Sulla cima di una montagna del Cile, a 2200 metri sopra il livello del mare, l'osservatorio interamericano di Cerro Tololo ospita il telescopio Blanco di 4 metri, con il quale gli scienziati studiano il cielo dal 1976. Poiché i progressi tecnologici si traducono in una produzione esponenziale di dati, adesso il limite maggiore riguarda la velocità con cui si può vagliare questa mole crescente di informazioni. Inevitabilmente, data la prepotente e inarrestabile rivoluzione che l'Intelligenza Artificiale sta causando in tutti i campi, una collaborazione internazionale di astronomi ha sviluppato un modello di apprendimento automatico per individuare nelle immagini del telescopio le galassie deboli. Utilizzando il modello, si è riusciti ad estrarre da 11 milioni di immagini ben 581 candidati fortemente indiziati come lenti gravitazionali, 562 dei quali erano precedentemente ignoti; tra questi, otto risultano essere quasar con immagine quadrupla.

 La nuova indagine è stata condotta da un nutrito team internazionale (ci sono anche alcuni nomi italiani, dall'osservatorio astrofisico di Trieste) che appartiene alle due collaborazioni DELVE e DES. Come descritto nell'articolo, pubblicato il 1° settembre su Astrophysical Journal., si è partiti dal catalogo DECam (prima release) per lo studio della Energia Oscura nell'emisfero meridionale. Questa lista contiene circa 520 milioni di sorgenti astronomiche distribuite sul 10% dell'intera volta celeste, con una magnitudine limite pari a 24 nel visibile e 23 nel vicino infrarosso. Un campione di 11 milioni di oggetti non puntiformi è stato selezionato in base al colore e alla luminosità e, per ciascuno di essi, le immagini sono state analizzate tramite una rete neurale "convolutional neural network" (CNN) a cinque livelli, addestrata per classificare le potenziali lenti gravitazionali. Ne è venuta fuori una lista di circa 50000 candidati, poi sottoposti comunque ad ulteriore vaglio di esseri umani, il cui lavoro è stato quindi ridotto di un fattore 220 grazie all'algoritmo. Alla fine, gli autori dello studio hanno ricavato i 581 candidati migliori e li hanno suddivisi in un gruppo di 55 candidati di "grado A", 149 di "grado B" e 377 di "grado C". Le prime risultano davvero probabili lenti gravitazionali e sono tutte riportate nell'immagine di apertura; ciascun riquadro mostra una porzione ampia quasi 12 secondi d'arco, centrata sul candidato. 

 In precedenza, sui milioni di galassie già catalogate, gli astronomi ne avevano individuate circa 1000 soggette a lente gravitazionale. Le galassie fortemente lente aiutano gli scienziati a interrogarsi su alcune delle più grandi domande dell'astronomia, dalla natura della materia oscura al tasso di espansione dell'universo. Ma poiché molte delle più grandi ricerche astronomiche del mondo si svolgono nell’emisfero settentrionale, solo di recente gli astronomi hanno iniziato a osservare rigorosamente l’intero cielo meridionale.

lens distribution

Distribuzione delle lenti gravitazionali note sulla volta celeste (in rosso quelle individuate nel muovo studio). Le coordinate sono quelle equatoriali e la fascia vuota corrisponde al piano della Via Lattea. - Credits: Zaborowski et al./ ApJ - Processing: Marco DI Lorenzo

 Questo sforzo è stato aiutato dalla Dark Energy Camera (DECam) del Blanco Telescope, che ha visto la prima luce nel 2012. La fotocamera è specificamente progettata per visualizzare ampie aree di cielo contemporaneamente ed una singola immagine cattura un'area 20 volte quella sottesa dalla Luna vista dalla Terra. Zabrowski e colleghi sono stati i primi ad applicare l’apprendimento automatico ai dati pubblici del "DECam Local Volume Exploration Survey" (DELVE), la survey iniziata nel 2019. 

 Sebbene le potenzialità delle nuove tecnologie siano formidabili, esse costringono gli astronomi a considerare cosa comporti questa nuova era di database giganteschi e di modelli di apprendimento automatico. Innanzitutto, i modelli sono validi quanto lo sono i dati su cui li addestriamo e, nel caso di forti lenti gravitazionali, ci sono così pochi esempi reali che gli scienziati sono costretti ad addestrare le reti su quelli artificiali. Pertanto, l'algoritmo potrebbe essere ottimo nel trovare lenti evidenti e comuni, ma quelle peculiari potrebbero passare inosservate; per ora, dicono gli esperti, è bene che gli esseri umani restino coinvolti nella ricerca, finché non saremo in grado di addestrare modelli di apprendimento automatico anche su obiettivi più rari. Un'altra limitazione è che le idee degli astronomi su ciò che visivamente conta come una lente forte sono soggettive. Gli scienziati devono raggiungere un consenso che indichi ai modelli cosa selezionare in primo luogo.

Anche se il machine learning non è infallibile, il suo punto di forza è la velocità. Le noiose classificazioni delle immagini, che richiedono mesi ai ricercatori, richiedono ai modelli solo poche ore. Con sempre più dati a nostra disposizione, questo studio dimostra che l’apprendimento automatico può portare le persone al passo successivo: capire cosa ci dicono le lenti forti sull’universo. "Ci sono molti tipi di analisi che puoi davvero fare", dice Zaborowski. “Con questi dati, puoi iniziare a rispondere alle domande scientifiche”.