NASA и IBM выпустили модель Geospatial AI Foundation с данными наблюдения за Землёй
Как сообщает habr.com, NASA и IBM Research презентовали первую базовую модель геопространственного искусственного интеллекта с открытым исходным кодом. Она включает данные наблюдения Земли.
Изображение северо-запада Исландии в полноцветном режиме HLS, полученное 11 июля 2023 года / NASA
Модель была создана с использованием набора данных Harmonized Landsat Sentinel-2 (HLS) НАСА. Её можно применять для отслеживания изменений в землепользовании, мониторинга стихийных бедствий и прогнозирования урожайности.
HLS Geospatial FM доступна в Hugging Face, общедоступном репозитории моделей машинного обучения с открытым исходным кодом.
В разработке модели принимала участие группа NASA по межведомственному внедрению и расширенным концепциям (IMPACT). Она работает над программой NASA «Системы данных по наукам о Земле» (ESDS) и отвечает за расширение использования данных наблюдения за счёт инноваций, партнёрских отношений и технологий, включая применение ИИ.
«Фундаментальные модели ИИ для наблюдения за Землей обладают огромным потенциалом для решения сложных научных проблем и ускорения более широкого развёртывания ИИ в различных приложениях», — говорит д-р Рахул Рамачандран, менеджер IMPACT.
Наряду с NASA и IBM Research в работе участвовали Центр геопространственной аналитики Университета Кларка, ЕКА (Европейское космическое агентство), Геологическая служба США и Окриджская национальная лаборатория Министерства энергетики США.
Эта работа является частью Инициативы НАСА по научным исследованиям с открытым исходным кодом (OSSI), целью которой является создание инклюзивного, прозрачного и открытого для сотрудничества научного сообщества в течение следующего десятилетия.
Разработка HLS Geospatial FM началась в январе 2023 года.
Базовые модели (FM) — это типы моделей ИИ, обученные на широком наборе неразмеченных данных. Их можно использовать для разных задач и применять информацию об одной ситуации к другой. Цель работы NASA и IBM — предоставить исследователям более простой способ анализа и извлечения информации из больших наборов данных, связанных с земными процессами.
«Мы считаем, что базовые модели могут изменить способ анализа данных наблюдений и помочь нам лучше понять планету», — говорит главный научный сотрудник НАСА Кевин Мерфи.
AI FM может сыграть ключевую роль в понимании взаимосвязанных процессов на планете и климатических последствий происходящих природных и антропогенных изменений.
Ей не нужны большие обучающие наборы данных, создание которых может быть трудоёмким. Возможность обучать FM на гораздо меньших наборах позволит сэкономить время и деньги. Также модель упростит создание приложений, которые будут использовать её выходные данные для выполнения конкретной задачи.
HLS — это логический набор данных, на котором основывается работа FM. Проект HLS предоставляет согласованные данные об отражательной способности поверхности от Operational Land Imager (OLI) с бортов спутников Landsat 8 и 9 и Multi-Spectral Instrument (MSI) с бортов европейских спутников Copernicus Sentinel-2A и Sentinel-2B. Комбинированные измерения датчиков позволяют проводить глобальные наблюдения за сушей каждые 2–3 дня с пространственным разрешением 30 метров.
Изображения HLS можно просматривать в интерактивном режиме с помощью инструмента визуализации данных Worldview Earth science и загружать через их через Earthdata Search.
IBM Research обучила HLS Geospatial FM на суперкомпьютере IBM Cloud Vela, используя стек IBM watsonx FM, который представляет собой облачную платформу для развёртывания FM. Стек в настоящее время работает в научной управляемой облачной среде NASA (SMCE). Он предназначен для ускорения научных исследований NASA, обеспечивая доступ к облачным ресурсам для быстрого прототипирования.
FM уже применялась для картирования паводков и идентификации последствий пожаров. Кроме того, модели применили для картографирования земного покрова и типов сельскохозяйственных культур в различных географических регионах на территории Соединённых Штатов.
Наряду с работой над HLS Geospatial FM, NASА и IBM разрабатывают другие приложения, включая большую языковую модель, основанную на литературе по наукам о Земле.