La NASA ha una enorme quantità di dati e ne riceve sempre di più ogni giorno. Mentre alcuni dati vengono elaborati immediatamente, gran parte dei dati viene archiviata per essere elaborata in seguito, talvolta anche anni dopo. Questa situazione deve cambiare se i ricercatori vogliono utilizzare i dati per indagare su questioni critiche con caratteristiche in continua evoluzione, come il cambiamento climatico globale. Per aumentare la capacità di elaborare e utilizzare questi dati tempestivamente, il Marshall Space Flight Center della NASA ha annunciato un programma di sviluppo congiunto con IBM Research per elaborare i dati della NASA utilizzando la tecnologia di intelligenza artificiale di fondazione di IBM. La collaborazione di IBM e NASA all’interno di questo programma ha come obiettivo la ricerca contro i cambiamenti climatici.
Un nuovo modello di intelligenza artificiale (AI) è stato sviluppato da IBM per fornire una base solida e versatile per il monitoraggio delle emissioni di carbonio e l’analisi dell’impatto dei cambiamenti climatici. Utilizzando dati satellitari della NASA, il modello open source è stato pubblicato sulla piattaforma Hugging Face. È la prima volta che la NASA collabora con un fornitore tecnologico per un tale modello.
IBM e NASA insieme per studiare cambiamento climatico
IBM afferma che il modello sarà addestrato su immagini dei satelliti della NASA. Il modello di fondazione geospaziale è costruito su tecnologie enterprise sviluppate da IBM come parte della sua piattaforma watsonx.ai, lanciata a maggio. La piattaforma viene presentata da IBM come soluzione alla mancanza di dati etichettati sia nei campi scientifici che in quelli aziendali.
Uno dei problemi più grandi che le aziende e gli scienziati del clima devono affrontare è la mancanza di dati etichettati o dati in un formato accessibile. Uno studio pubblicato all’inizio di quest’anno da Microsoft e Tata Consultancy Services ha scoperto che l’80% delle aziende non stava divulgando gli obiettivi sulle emissioni operative, in parte a causa della mancanza di dati lungo la catena di approvvigionamento e di trend globali. IBM sostiene che l’AI può contribuire a semplificare questo processo.
Quantità di dati enorme
Per mettere questa attività in prospettiva, il set di dati GPT-3, che ha portato allo sviluppo della piattaforma di intelligenza artificiale ChatGPT, rappresenta circa 45TB (terabyte) di dati. In confronto, la NASA stima che il suo set di dati potrebbe arrivare a oltre 250PB (petabyte). Con 1PB equivalente a 1.000TB, il set di dati della NASA è oltre 5.000 volte più grande del set di dati GPT-3, rendendo questo un compito monumentale, ma i benefici potrebbero essere rivoluzionari.
In precedenza, IBM stimava che il 90% dei dati raccolti non viene mai utilizzato, e nella loro presentazione alla stampa, IBM e NASA hanno sottolineato che “Attualmente, la metà di tutte le scoperte scientifiche proviene da dati archiviati, il che rende difficile per i ricercatori studiare minacce in continua evoluzione come il cambiamento climatico.” Sfruttare in modo efficiente l’enorme quantità di dati archiviati richiede la potenza dell’intelligenza artificiale. Le massicce risorse cloud della ricerca di IBM, le esperienze collettive degli esperti di intelligenza artificiale dell’azienda e la sua tecnologia di modello di fondazione di IA aiuteranno la NASA a filtrare ed analizzare i dati di scienze della terra in giorni o mesi anziché anni o addirittura decenni.
Il primo modello di fondazione sarà addestrato su oltre 300.000 pubblicazioni di scienze della terra, da cui verranno estratte informazioni contestuali. Questa fase migliorerà la ricerca e l’indagine dei dati esistenti. Un secondo modello sarà addestrato sui dati satellitari Harmonized Landset-Sentinel2 (HLS2) del USGS (United States Geological Survey) e della NASA. HLS2 utilizza dati dai satelliti congiunti NASA/USGS Landsat 8 e Landsat 9 e dai satelliti ESA (Agenzia Spaziale Europea) Sentinel-2A e Sentinel-2B per generare dati di riflettanza superficiale armonizzati e pronti per l’analisi ogni due o tre giorni.
IBM e NASA per la mappatura di incendi e inondazioni
I modelli sono stati successivamente perfezionati su dati etichettati per la mappatura delle inondazioni e delle cicatrici da incendi nello stesso periodo. Ciò migliorerà significativamente il monitoraggio e le previsioni per gli incendi boschivi e consentirà al modello stesso di funzionare in modo più efficiente. Con un ulteriore affinamento, il modello base può essere riutilizzato per compiti come il monitoraggio della deforestazione, la previsione dei raccolti o il rilevamento e il monitoraggio dei gas serra.
I ricercatori di IBM e NASA stanno collaborando anche con la Clark University per adattare ulteriormente il modello open source per un’ampia gamma di applicazioni, inclusa la segmentazione delle serie temporali e la ricerca di somiglianze.
I modelli di fondazione geospaziale possono essre addestrati su grandi dataset di dati non etichettati, e possono essere affinati per casi d’uso specifici utilizzando dati etichettati. Ciò significa che il modello geospaziale pubblicato da IBM può essere ri-tarato in base alle informazioni aziendali o ai dati già esistenti per un uso scientifico specifico.
Anche se viene pubblicato su Hugging Face, consentendo agli sviluppatori di condividere liberamente modelli AI, inizialmente sarà disponibile una versione commerciale su watsonx entro la fine dell’anno. Questo, afferma l’azienda, consentirà alle imprese di utilizzare le informazioni nel monitoraggio delle emissioni e negli obiettivi di “zero netto” o “carbon neutrality” . Gli obiettivi di “zero netto” si riferiscono agli sforzi e alle strategie volte a raggiungere un equilibrio tra le emissioni di gas serra prodotte e le emissioni rimosse o compensate. L’obiettivo è di assicurarsi che l’ammontare totale di emissioni di gas serra rilasciate nell’atmosfera sia uguale o inferiore all’ammontare di emissioni rimosse o compensate.
Il ruolo dell’AI di IBM
“Il ruolo essenziale delle tecnologie open source per accelerare aree critiche di scoperta come il cambiamento climatico non è mai stato così chiaro,” ha detto Sriram Raghavan, vicepresidente di IBM Research AI. “Unendo gli sforzi di IBM nel creare sistemi AI flessibili e riutilizzabili con il repository di dati satellitari terrestri della NASA e rendendolo disponibile su Hugging Face, possiamo sfruttare il potere della collaborazione per implementare soluzioni più veloci ed efficaci che miglioreranno il nostro pianeta.”