{/* Extracted from Header.astro - Use appropriate classes/styles if animations needed */}

Panphorte, il pangenoma italiano legge le sequenze del DNA finora scartate

Politecnico Milano e GenoGra firmano Panphorte: -71,69% di memoria e +34,4% di letture esatte sulle ripetizioni del DNA legate al cancro.

Il Politecnico di Milano e la startup GenoGra hanno presentato una tecnica per leggere parti del DNA finora ignorate dai computer perché troppo onerose da gestire. Lo studio si chiama Panphorte, pubblicato su Frontiers in Bioinformatics il 1 maggio 2026 e riduce fino al 71,69% la memoria richiesta dall'analisi, aumentando del 34,4% le letture corrette sui dati reali.

La firma del Politecnico di Milano e della startup GenoGra

Panphorte nasce nel laboratorio NECSTlab del Politecnico di Milano ed è guidato da Mirko Coggi insieme a Lorenzo Basile, Beatrice Branchini, Gabriele Amodeo e dal professore Marco D. Santambrogio. La startup GenoGra, fondata da Guido Walter Di Donato e accelerata da PoliHub e Bocconi 4 Innovation, ha chiuso un round pre-seed da 1 milione di euro il 16 febbraio 2026 con Maia Ventures, PM Holding e Terra Next, destinato in prima battuta agli usi agro industriali e in parallelo alla validazione clinica.

Il problema affrontato è la pangenomica, cioè la mappatura della variabilità genetica di una intera specie. Il riferimento mondiale è lo Human Pangenome Reference del NIH, che con 47 assemblaggi diploidi ha tagliato del 34% gli errori nelle varianti corte e raddoppiato il numero di varianti strutturali rilevate rispetto al vecchio GRCh38. Panphorte si inserisce su questa infrastruttura come strato di compressione e riscrittura topologica del grafo.

Il 12% del genoma che i pipeline scartavano

Le sequenze al centro della tecnica sono le Copy Number Variations e le ripetizioni in tandem variabili: blocchi di DNA che in una persona possono essere ripetuti due volte e in un'altra anche quaranta. Riguardano circa il 12% del genoma umano e oltre il 70-80% dei geni associati al cancro, ma negli algoritmi a grafo vengono rappresentate come percorsi alternativi aciclici, una forzatura che corrompe l'allineamento delle letture e che fino a oggi costringeva i ricercatori a buttare via l'informazione.

Panphorte introduce cicli espliciti dentro i superbubbles e isola i tratti ripetuti condivisi tra i diversi cammini, senza perdita di dati. Sui grafi sintetici e reali di prova ha tagliato la memoria fino al 71,69% sul set da 10.000 CNV e ha guadagnato fino al 34,4% di letture esatte sulle long-read da 100 kb. Il codice C++ è pubblico su GitHub. È un dato di peso clinico: il 30% dei portatori della microdelezione 22q11.2 sviluppa disturbi psichiatrici come autismo o schizofrenia, e finora quei frammenti non venivano nemmeno letti.

Cosa cambia per la medicina di precisione

Per i laboratori italiani il risultato pratico è duplice: il fabbisogno hardware per processare un pangenoma scende di due terzi e i tempi di analisi seguono. Significa che un ospedale diagnostico può eseguire confronti pangenomici su workstation standard invece che su cluster HPC, ampliando l'accesso alla medicina personalizzata sui tumori solidi, sulle malattie rare e sulle neuropsichiatrie a base genetica. GenoGra dichiara di stare sviluppando proof of concept con università, ospedali e laboratori diagnostici.

L'effetto attraversa anche filoni di ricerca lontani dalla clinica: la stessa precisione computazionale che oggi serve a leggere il DNA umano alimenta studi ambientali come la scoperta di microplastiche in Antartide e progetti europei di lungo periodo come il primo volo di Ariane 6, dove la sovranità tecnologica italiana ed europea si misura su infrastrutture proprietarie. Sul versante biomedico, una lettura più completa del DNA si intreccia con i nuovi studi internazionali, come la ricerca sulla salute mentale materna, che cercano biomarcatori genetici per i disturbi del post partum.

Il prossimo passo per Panphorte è la certificazione clinica e l'integrazione nei flussi di analisi degli ospedali partner. Se la pipeline regge sui dati reali al di fuori dei dataset di validazione, una porzione di genoma che la ricerca ha trattato come rumore tornerà nei referti.

Pubblicato il: 4 giugno 2026 alle ore 15:11