IBM e NASA criam modelo fundacional de IA geoespacial em código aberto
O modelo fundacional geoespacial watsonx, desenvolvido a partir de dados de satélites da NASA, será agora disponível em código aberto no Hugging Face.
O acesso aos dados sempre atualizados continua a ser um desafio significativo na ciência climática, onde as condições ambientais mudam quase diariamente.
Com as crescentes quantidades de informações, segundo a NASA , estima-se que até 2024 os cientistas terão 250 mil terabytes de dados de sobre novas missões – e junto de pesquisadores, ainda enfrentam obstáculos na análise desses grandes conjunto de dados.
Como parte de um Acordo de Lei do Espaço com a NASA, a IBM estabeleceu no início deste ano a construção de um modelo fundacional de IA para dados geoespaciais.
É por isso que a IBM e a plataforma de IA de código aberto, Hugging Face, anunciaram que o modelo fundacional geoespacial watsonx da IBM, desenvolvido a partir de dados de satélites da NASA, será agora disponível em código aberto no Hugging Face.
Será o maior modelo fundacional geoespacial no Hugging Face e o primeiro modelo fundacional de IA de código aberto construído em colaboração com a NASA, diz a Big Blue.
Esse esforço “será um avanço para a democratização do acesso e aplicação da IA para gerar novas possibilidades com o monitoramento do clima e na ciência da Terra”.
O modelo, treinado em conjunto por IBM e NASA ao longo de um ano com dados do satélite Harmonized Landsat Sentinel-2 (HLS) em todo o território continental dos Estados Unidos, e aperfeiçoado com dados mapeados de enchentes e áreas de incêndios ambientais, demonstrou até hoje “uma melhora de 15% sobre as técnicas de última geração, usando a metade dos dados mapeados”.
Com ajustes adicionais aperfeiçoados, o modelo base pode ser utilizado para tarefas como acompanhar o desmatamento, prever a produtividade das lavouras ou detectar e monitorar gases de efeito estufa.
Pesquisadores da IBM e da NASA também estão trabalhando com a Clark University para adaptar o modelo para aplicações como segmentação de séries temporais e pesquisa por similaridade.