La Agencia Espacial Europea (ESA) e IBM han presentado TerraMind, un nuevo modelo de observación de la Tierra que ha sido publicado en código abierto en la plataforma HuggingFace. El modelo ha sido entrenado previamente en TerraMesh, el conjunto de datos geoespaciales más grande disponible construido por investigadores como parte del proyecto TerraMind.
TerraMind, en la que ha trabajado investigadores de IBM, la ESA, KP Labs, Julich Supercomputing Center (JSC) y la Agencia Espacial Alemana (DLR), se engloba en el marco de la iniciativa FAST-EO liderada por la ESA para mejorar el acceso a los modelos fundacionales dentro de la comunidad de observación de la Tierra.
El modelo tiene una arquitectura única de codificador-decodificador basada en transformadores simétricos, que está diseñada para trabajar con entradas basadas en píxeles, tokens y secuencias, así como aprender correlaciones entre modalidades distintas de datos.
A pesar de haber sido entrenado con 500.000 millones de tokens, TerraMind es un modelo pequeño y ligero, que utiliza 10 veces menos recursos informáticos que el uso de modelos estándar para cada modalidad. Esto significa que los usuarios pueden implementarlo a escala con un coste menor, al tiempo que reducen el consumo total de energía en la etapa de inferencia.
Nueve millones de muestras de datos
Durante la creación del conjunto de datos, los investigadores incluyeron información de todos los biomas, tipos de usos y coberturas del suelo y regiones, lo que permite que el modelo sea igualmente válido para cualquier aplicación en todo el mundo, con un sesgo limitado.
El conjunto de datos incluye 9 millones de muestras de datos distribuidas globalmente, alineadas espacio-temporalmente en nueve modalidades principales: observaciones realizadas por sensores en satélites, la geomorfología de la superficie de la Tierra, las características de la superficie que son importantes para la vida en la Tierra (vegetación y uso del suelo) y descripciones básicas de ubicaciones y sus características (latitud, longitud y descripciones de texto sencillas).
“TerraMind combina información de varias modalidades de datos de entrenamiento para aumentar la precisión de sus resultados", ha asegurado Simonetta Cheli, directora de Programas de Observación de la Tierra de la ESA y responsable de Esrin.