La ricerca scientifica sta cambiando, e stavolta non parliamo di strumenti che ti aiutano a cercare paper o a scrivere codice più velocemente. Kosmos, sviluppato da Edison Scientific, è un sistema autonomo che fa ricerca vera; analizza dati, legge migliaia di articoli scientifici, formula ipotesi e produce scoperte originali. Una singola run di Kosmos dura fino a 12 ore; durante questo tempo il sistema esegue circa 42.000 righe di codice e legge 1.500 paper scientifici. Un ricercatore scientifico artificiale che lavora senza sosta.


Kosmos usa world models strutturati come memoria a lungo termine. Questi modelli fungono da database interrogabile che conserva entità, relazioni, risultati sperimentali e domande aperte; si aggiornano dopo ogni compito e permettono al sistema di mantenere coerenza. È come dare a un ricercatore un quaderno quasi infinito dove annotare tutto e consultarlo quando serve.
Il sistema coordina due agenti principali; uno per l’analisi dati e uno per la ricerca bibliografica. A ogni ciclo, Kosmos propone fino a dieci compiti basati sull’obiettivo di ricerca e sullo stato attuale del world model. Gli agenti scrivono codice, lo eseguono in ambienti notebook, recuperano e leggono paper; poi scrivono output strutturati e citazioni nel world model. Questo ciclo si ripete per molte iterazioni finché, al termine, un componente di sintesi genera un report scientifico dove ogni affermazione è collegata a un passaggio specifico della letteratura primaria.
Kosmos: l’AI replica o anticipa i ricercatori umani
La prova del nove per qualsiasi sistema di questo tipo sono le scoperte concrete. Edison Scientific ha validato Kosmos collaborando con gruppi accademici su sette casi di studio. Tre di queste scoperte hanno replicato risultati umani non ancora pubblicati o pubblicati dopo il cutoff dei modelli linguistici usati da Kosmos; le altre quattro hanno prodotto contributi originali alla letteratura scientifica.


Nel primo caso, Kosmos ha esaminato i dati chimici del cervello di topi sottoposti a ipotermia ; ha scoperto che il processo di gestione dei nucleotidi (i mattoni del DNA) era quello più modificato, con una diminuzione delle sostanze di partenza e un aumento dei prodotti finali. In pratica durante l’ipotermia protettiva, il cervello ricicla i nucleotidi esistenti invece di produrne di nuovi da zero. Questa scoperta corrispondeva esattamente a una ricerca umana indipendente che non era ancora stata pubblicata quando Kosmos ha fatto la sua analisi.
Nel secondo caso, lavorando su dati ambientali dalla fabbricazione di celle solari a perovskite, Kosmos ha identificato l’umidità assoluta durante l’annealing termico come determinante principale dell’efficienza dei dispositivi; ha trovato una soglia critica sopra i 60 g/m³ oltre la quale i dispositivi falliscono. Un risultato che corrispondeva a un preprint in scienza dei materiali ancora non accessibile a Kosmos.
Nel settimo caso Kosmos ha trovato un meccanismo che spiega perché certi neuroni sono più vulnerabili durante l’invecchiamento. Esaminando i dati genetici di cervelli di topi giovani e anziani, Kosmos ha scoperto che i neuroni della corteccia entorinale, i primi a mostrare danni nell’Alzheimer, producono meno proteine chiamate flippasi con l’avanzare dell’età. La scoperta è stata confermata analizzando dati indipendenti da pazienti umani con Alzheimer; la riduzione delle flippasi in questi neuroni compare esattamente quando inizia l’accumulo della proteina tau danneggiata in quella zona del cervello.
Circa sei mesi di lavoro in 12 ore: il nuovo benchmark per l’accelerazione scientifica
Esperti indipendenti hanno giudicato accurato il 79,4% delle affermazioni campionate da tre report rappresentativi; le affermazioni basate su analisi dati raggiungono l’85,5% di accuratezza, quelle da revisione bibliografica l’82,1%, mentre le affermazioni di sintesi che combinano evidenze scendono al 57,9%. Quest’ultimo dato indica che Kosmos tende a fare claim eccessivamente forti e può inseguire correlazioni statisticamente significative ma scientificamente irrilevanti.
Il valore più sorprendente riguarda i tempi di esecuzione. I tester di Kosmos hanno stimato che una run di 20 cicli della durata di 12 ore equivalga a circa 6 mesi di lavoro di un ricercatore esperto. Per validare questa affermazione, hanno usato tre approcci; il primo si basa su sondaggi presso i collaboratori accademici che hanno fornito obiettivi di ricerca a Kosmos e poi stimato quanto tempo ci sarebbe voluto per raggiungere le stesse conclusioni manualmente.
Il secondo confronta i tempi necessari per tre scoperte che Kosmos ha replicato indipendentemente; in quei casi i ricercatori umani avevano impiegato circa quattro mesi. Il terzo calcola il tempo assumendo 15 minuti per leggere un paper e 2 ore per completare una traiettoria di analisi dati.
Limiti e futuro della ricerca scientifica
Kosmos non è perfetto e i suoi creatori sono stati trasparenti sugli attuali limiti. Il sistema ha difficoltà con dataset superiori a 5 GB; e non eccelle nell’analisi di dati grezzi come immagini o file di sequenziamento non processati. Inoltre, non può accedere autonomamente a dati pubblici di fonti esterne.
Il fatto che il sistema funzioni in modo probabilistico significa che eseguire Kosmos più volte sullo stesso problema può portare a scoperte differenti; anche i percorsi di ricerca dipendono molto da come viene formulata la domanda iniziale. Nella versione attuale i ricercatori non possono intervenire mentre Kosmos sta lavorando, perdendo la possibilità di indirizzarlo verso direzioni più interessanti.
Un altro problema riguarda la valutazione delle scoperte. Identificare quali scoperte siano accurate, nuove e significative richiede tempo umano considerevole; non esiste ancora un metodo automatizzato affidabile per questa valutazione. Sul fronte pratico, Kosmos è disponibile sulla piattaforma Edison a 200 dollari per run (200 crediti a 1 dollaro/credito); esiste un tier gratuito per accademici. Non è un chatbot; va pensato più come un kit di agenti AI, qualcosa che si usa per domande ad alto valore.
Kosmos aiuta i ricercatori umani, non li sostituisce. Il workflow inizia con dataset di alta qualità curati da umani e termina con interpretazione e validazione critica umana. La qualità e il formato dei dati di input umani influenzano significativamente le scoperte in output; Kosmos fornisce soluzioni più valide quando riceve dati ben etichettati, formattati correttamente e normalizzati. Con sistemi come Kosmos il ruolo dello scienziato si sposta verso la valutazione e interpretazione dei risultati; quindi, la supervisione umana resta cruciale.
Per approfondire puoi leggere il Paper Kosmos: An AI Scientist for Autonomous
Discovery disponibile su arxiv.org.










