Numa parceria, a IBM vai aplicar tecnologia de modelo fundacional de inteligência artificial aos dados de satélite de observação da Terra da NASA, com o objetivo de proporcionar aos investigadores uma forma mais fácil de analisar e extrair conhecimento a partir dos dados
A IBM e o Centro Marshall de Voos Espaciais da NASA anunciaram uma colaboração para utilizar a tecnologia de Inteligência Artificial (IA) da IBM para descobrir novas perspetivas a partir do enorme volume de dados científicos geoespaciais e da terra da NASA. Em comunicado, explicam que o trabalho conjunto vai aplicar, pela primeira vez, a tecnologia de modelo fundacional de IA aos dados de satélite de observação da Terra da NASA. Os modelos fundacionais são tipos de modelos de IA que são treinados num amplo conjunto de dados não etiquetados que podem ser utilizados para diferentes tarefas ou que podem aplicar informação sobre uma situação a outra. Estes modelos têm avançado rapidamente no campo da tecnologia de processamento de linguagem natural (PLN) nos últimos cinco anos. “A beleza dos modelos fundacionais é que podem potencialmente ser utilizados para muitas aplicações posteriores”, afirma Rahul Ramachandran, senior research scientist do Centro Marshall de Voos Espaciais da NASA em Huntsville, Alabama, nos EUA. Acrescenta: “a construção destes modelos não pode ser abordada por pequenas equipas. São necessárias equipas em diferentes organizações para trazer as suas diferentes perspetivas, recursos e conjuntos de competências”. Segundo a IBM, as observações da Terra, que permitem aos cientistas estudar e monitorizar o planeta, estão a ser recolhidas a um ritmo e volume sem precedentes, sendo necessárias novas abordagens para extrair conhecimento destes dados. Assim , o objetivo deste trabalho é proporcionar aos investigadores uma forma mais fácil para analisar e extrair conhecimento a partir destes grandes conjuntos de dados. A IBM e a NASA planeiam desenvolver várias novas tecnologias para extrair informação das observações da Terra. Um projeto irá treinar um modelo de base de inteligência geoespacial da IBM com base num conjunto de dados Harmonized Landsat Sentinel-2 (HLS) da NASA, um registo da superfície terrestre e das alterações de uso do solo capturadas por satélites na órbita terrestre. Ao analisar os petabytes de dados de satélite para identificar alterações na pegada geográfica de fenómenos tais como desastres naturais, rendimentos cíclicos de colheitas e habitats de vida selvagem, esta tecnologia de modelo fundacional vai ajudar os investigadores a fazer uma análise crítica dos sistemas ambientais do planeta. Espera-se que a colaboração tenha, também, como resultado um corpus de literatura de ciências da Terra facilmente pesquisável. A IBM desenvolveu um modelo de PLN treinado com quase 300 mil artigos de revistas de ciência da Terra para organizar a literatura e facilitar a descoberta de novos conhecimentos. Contém uma das maiores cargas de trabalho de IA treinada no software Red Hat OpenShift até à data, o modelo totalmente treinado utiliza PrimeQA, o sistema de perguntas e respostas multilingues de código aberto da IBM. Além de fornecer um recurso aos investigadores, o novo modelo linguístico para as ciências da Terra poderia infundir-se nos processos de gestão e administração de dados científicos da NASA. “Os modelos fundacionais demonstraram ter sucesso no processamento de linguagem natural, e é agora o momento de o expandir para novos domínios e modalidades importantes para as empresas e a sociedade”, explica Raghu Ganti, principal researcher da IBM. “A aplicação de modelos fundacionais a fatores geoespaciais, sequência de eventos, séries temporais, e outros fatores não linguísticos no âmbito dos dados das ciências da Terra, pode fazer com que ideias e informações muito valiosas estejam disponíveis para um grupo muito mais vasto de investigadores, empresas e cidadãos. Em última análise, poderá ajudar um maior número de pessoas que trabalham em algumas das nossas questões climáticas mais prementes”, completa. Outros potenciais projetos conjuntos neste acordo incluem a construção de um modelo fundacional para a previsão meteorológica e climática utilizando o MERRA2, um conjunto de dados de observações atmosféricas. Esta colaboração é parte da Iniciativa de Ciência de Código Aberto da NASA, um compromisso para a construção de uma comunidade científica aberta, inclusiva, transparente e colaborativa durante a próxima década. |