Sommario
* La scoperta che cambia la microbiologia * Il ruolo del machine learning nell'esplorazione genomica * Due studi, una stessa conclusione * DefensePredictor e il censimento delle difese batteriche * Conferme sperimentali e nuovi sistemi antifago * Verso una nuova generazione di strumenti molecolari
La scoperta che cambia la microbiologia
I batteri combattono i virus da miliardi di anni, eppure la scienza ne conosceva solo una frazione minima delle armi a disposizione. Due ricerche pubblicate contemporaneamente sulla rivista Science nel 2026 hanno portato alla luce un arsenale molecolare di dimensioni sorprendenti: centinaia di migliaia di proteine antivirali fino a oggi completamente ignorate. La scoperta è stata possibile grazie ad algoritmi di apprendimento automatico progettati per scandagliare i genomi batterici alla ricerca di sequenze genetiche coinvolte nella difesa immunitaria. José Antonio Escudero, microbiologo del CSIC National Center for Biotechnology di Madrid, estraneo a entrambi gli studi, ha definito i risultati "un tesoro per qualsiasi biochimista". Non si tratta di un'iperbole. Le precedenti scoperte di sistemi immunitari nei batteri hanno prodotto rivoluzioni tecnologiche enormi: basti pensare al sistema di editing genetico CRISPR-Cas9 e agli enzimi di restrizione, entrambi strumenti oggi fondamentali nell'ingegneria genetica. L'idea che questo nuovo catalogo possa contenere la prossima generazione di tecnologie molecolari è tutt'altro che remota, e la comunità scientifica internazionale ne è consapevole.
Il ruolo del machine learning nell'esplorazione genomica
Guardare il genoma di un batterio equivale, in larga parte, a osservare materia oscura biologica. La metafora è di Escudero, e rende bene l'idea: la maggior parte delle sequenze genetiche batteriche resta priva di una funzione nota. Studi precedenti avevano identificato oltre 250 proteine con ruolo difensivo contro le infezioni virali, ma i ricercatori sospettavano da tempo che il sistema immunitario batterico fosse molto più esteso e diversificato. Mancava però un metodo per verificarlo su larga scala. L'intelligenza artificiale ha colmato questa lacuna. I modelli di deep learning utilizzati nei due studi sono stati addestrati su enormi dataset di dati proteici e genomici, con l'obiettivo di riconoscere pattern associati alla funzione antivirale. La potenza di calcolo necessaria per analizzare migliaia di genomi batterici simultaneamente sarebbe stata impensabile anche solo un decennio fa. Oggi, invece, gli algoritmi riescono a setacciare milioni di sequenze e a classificarle con una precisione crescente, aprendo finestre su territori biologici inesplorati. Il risultato è un cambio di paradigma nella comprensione dell'immunità batterica.
Due studi, una stessa conclusione
I due gruppi di ricerca hanno lavorato in modo indipendente, con approcci distinti, eppure sono arrivati alla medesima conclusione: gli scienziati hanno sottostimato massicciamente il numero di sistemi di difesa batterici. Il primo studio, guidato da Aude Bernheim dell'_Institut Pasteur_ di Parigi, ha utilizzato modelli di apprendimento profondo addestrati su dati proteici e genomici per stimare l'ampiezza complessiva dell'immunità batterica. Il dato più eloquente riguarda la proporzione: in media, l'1,5% dei geni di un genoma batterico codifica proteine coinvolte nella difesa antivirale. È una cifra tre volte superiore alle stime precedenti. Ancora più significativo è il fatto che oltre l'85% delle famiglie proteiche individuate non era mai stato associato a funzioni immunitarie. Il secondo studio, condotto da Michael Laub del _Massachusetts Institute of Technology_, ha sviluppato uno strumento dedicato chiamato _DefensePredictor_. Entrambi i lavori convergono su un punto: ciò che sapevamo dell'immunità batterica era solo la punta di un iceberg, e la parte sommersa è immensa.
DefensePredictor e il censimento delle difese batteriche
_DefensePredictor_, lo strumento computazionale progettato dal team di Michael Laub, si basa su dati genetici e proteici estratti da 17.000 genomi batterici. L'algoritmo è stato concepito per identificare proteine con funzione difensiva analizzando sia la struttura delle sequenze sia il contesto genomico in cui si trovano. Testato su 69 ceppi diversi di _Escherichia coli_, il sistema ha individuato 624 proteine classificabili come componenti di sistemi immunitari. Di queste, oltre 100 erano del tutto sconosciute alla letteratura scientifica. Il numero è notevole se si considera che, per un singolo organismo modello già ampiamente studiato come _E. coli_, restava ancora così tanto da scoprire. "Ci sono centinaia di geni di cui non sapevamo nemmeno che fossero correlati alla difesa", ha commentato Escudero. La portata della scoperta suggerisce che ogni genoma batterico nasconda un repertorio immunitario molto più ricco di quanto ipotizzato, con implicazioni dirette per la microbiologia, la virologia e lo sviluppo di biotecnologie. Laub stesso ha sottolineato come la ricerca porti alla luce quanti sistemi restino ancora da caratterizzare.
Conferme sperimentali e nuovi sistemi antifago
Le previsioni computazionali, per quanto sofisticate, necessitano di validazione in laboratorio. Entrambi i gruppi hanno sottoposto i risultati a verifiche sperimentali rigorose. Il team di Bernheim ha condotto esperimenti su due specie batteriche, Escherichia coli e _Streptomyces albus_, confermando l'esistenza di 12 sistemi antifago mai precedentemente associati alla difesa antivirale. Questi sistemi proteggono i batteri dai batteriofagi, i virus che li infettano. Il gruppo di Laub ha invece verificato l'attività difensiva in 42 casi tra le proteine identificate da _DefensePredictor_. I numeri confermati in laboratorio rappresentano solo una frazione del totale predetto dagli algoritmi, il che significa che il lavoro di caratterizzazione è appena iniziato. Ogni nuovo sistema antifago scoperto potrebbe funzionare secondo meccanismi molecolari inediti, offrendo spunti per applicazioni pratiche. La biologia dei batteriofagi, del resto, è un campo in rapida espansione: i fagi vengono già studiati come alternativa agli antibiotici contro i batteri resistenti, e comprendere le difese batteriche è essenziale per rendere efficaci queste terapie.
Verso una nuova generazione di strumenti molecolari
La storia della biologia molecolare insegna che le scoperte fondamentali nell'immunità batterica hanno generato tecnologie trasformative, e del resto tanti sono gli studi sui batteri, come quello secondo cui alcuni batteri potrebbero divorare i tumori dall'interno. Gli enzimi di restrizione, individuati negli anni Settanta, hanno reso possibile il clonaggio del DNA. Il sistema CRISPR-Cas9, compreso nella sua funzione antivirale solo nel 2012, ha rivoluzionato la medicina e l'agricoltura. Oggi, con centinaia di migliaia di nuove proteine antivirali da esplorare, la comunità scientifica si trova davanti a un catalogo senza precedenti di potenziali strumenti biotecnologici. "C'è la speranza che da alcuni di questi nuovi sistemi possa emergere una prossima generazione di strumenti molecolari", ha dichiarato Laub. Non tutti i sistemi scoperti si riveleranno utili per applicazioni pratiche, naturalmente. Ma la varietà stessa del repertorio aumenta enormemente le probabilità di trovare meccanismi con proprietà uniche, sfruttabili per l'editing genetico, la diagnostica o la terapia. Il lavoro di caratterizzazione richiederà anni, forse decenni. Quel che è certo è che l'intelligenza artificiale ha aperto una porta che la microbiologia tradizionale, da sola, non sarebbe riuscita a varcare.