Medicina

Pangenoma: nuova visione più inclusiva del genoma umano

I ricercatori hanno rilasciato una raccolta di nuove numerose sequenze del Genoma Umano detta Pangenoma; questa permette un’immagine più realistica della diversità di diverse popolazioni umane rispetto a quanto fosse precedentemente disponibile. La nuova versione si basa sul genoma di riferimento umano esistente e aggiunge oltre 1000 nuove mutazioni geniche e quasi 120 milioni di coppie di basi, fornendo una risorsa inestimabile per la futura ricerca genetica.

Pangenoma – Credits: humanpangenome.org

Che cos’è il genoma?

Il genoma è l’insieme delle istruzioni del DNA, questo aiuta ogni creatura vivente a svilupparsi e vivere. Risulta noto che le sequenze del genoma differiscano leggermente tra tutti gli individui. Nel caso degli esseri umani, i genomi di due popoli sono, in media, più del 99% identici. Le piccole differenze contribuiscono all’unicità di ogni persona e possono fornire informazioni sulla sua salute, aiutando a diagnosticare la malattia, prevedere i risultati e guidare i trattamenti medici. Per comprendere queste differenze genomiche, gli scienziati hanno creato delle sequenze di riferimento del Genoma Umano da utilizzare come confronto per allineare, assemblare e studiare altre sequenze del Genoma Umano.

Il Genoma Umano

La sequenza originale di riferimento del genoma umano ha quasi 20 anni ed è stata regolarmente aggiornata con l’avanzare della tecnologia. Negli anni i ricercatori hanno risolto gli errori e scoperto più regioni del Genoma Umano. Tuttavia, è ancora limitato per quanto concerne la rappresentazione della diversità della specie umana. Questo è dovuto dal fatto che è costituito da genomi di sole circa 20 persone e la maggior parte della sequenza di riferimento proviene da un unico individuo.

Confronto dei due gruppi di cromosomi di un individuo – Credits: Nature

Tappe storiche importanti per la redazione del Genoma Umano

Nel 2001, il Progetto Genoma Umano ha pubblicato la prima bozza del Genoma Umano di riferimento. Questo negli anni ha subito continui aggiornamenti fino a quando ha raggiunto la sua versione attuale, nota come GRCh38. Questo è avvenuto nel 2022 con la pubblicazione del Genoma Umano completo che, purtroppo, non rappresenta con completezza la diversità della specie umana.

Colmare le lacune negli assemblaggi del genoma umano. Struttura degli assemblaggi del genoma umano GRCh38 e T2T-CHM13 – Credits: Nature

Il Pangenoma

Ognuno individuo presenta un genoma unico, quindi l’uso di una singola sequenza di genoma di riferimento per ogni persona può portare a disuguaglianze nelle analisi genomiche. L’attuale sequenza di riferimento possiede delle lacune che riflettono le informazioni mancanti, specialmente in aree ripetitive e di difficile lettura. I recenti progressi tecnologici come il sequenziamento del DNA long-read, che legge tratti più lunghi del DNA alla volta, hanno aiutato i ricercatori a colmare queste lacune per creare la prima sequenza completa del Genoma Umano. Ad esempio, prevedere una malattia genetica potrebbe non essere possibile per qualcuno il cui genoma si differenzia di molto da quello di riferimento. Per superare tale limitazione, un gruppo di ricerca denominato Human Pangenome Reference Consortium sta lavorando costantemente per la costruzione di un atlante più completo della varietà genetica umana, noto come Pangenoma, di cui si è pubblicata la prima bozza il 10 maggio 2023.

Pangenoma e la sua composizione

Utilizzando tecniche computazionali avanzate per allineare le varie sequenze del genoma, i ricercatori hanno costruito un nuovo modello di riferimento. Il Pangenoma copre oltre il 99% della sequenza prevista con una precisione superiore al 99%. Questo si basa sulla precedente sequenza del Genoma Umano di riferimento, aggiungendo oltre 100 milioni di nuove basi nel DNA. Nella precedente sequenza di riferimento la struttura era lineare e singola, il nuovo Pangenoma invece rappresenta contemporaneamente molte versioni diverse della sequenza del Genoma Umano. Ciò permette ai ricercatori di usufruire di un’ampia gamma di opzioni per l’utilizzo del Pangenoma, soprattutto nell’analisi di altre sequenze del Genoma Umano.

Pangenoma, grafico di valutazione – Credits: Nature

Differenze tra Pangenoma e l’attuale Genoma Umano

Si è assemblato il Pangenoma partendo dal DNA di 47 individui. Rispetto all’attuale Genoma Umano di riferimento si sono aggiunte 119 milioni di coppie di basi e 1115 nuove mutazioni di duplicazione genica, fornendo più opzioni per lo stesso tratto di DNA. Ogni persona porta un insieme accoppiato di cromosomi, il riferimento attuale include in realtà 94 sequenze di genoma distinte, con l’obiettivo di raggiungere 700 sequenze di genoma distinte entro il completamento del progetto.

Presentazione di 47 assemblaggi diploidi del genoma umano diversi accurati e quasi completi – Credits: Nature

Perchè il Pangenoma risulta di vitale importanza?

L’utilità principale del nuovo Pangenoma è la possibilità di identificare in modo più accurato varianti genomiche più grandi, chiamate varianti strutturali. Attualmente c’è la possibilità di rilevare varianti che non sono state identificate utilizzando metodi precedenti poiché dipendono da sequenze di riferimento lineari. Queste varianti strutturali possono estendersi fino a diverse migliaia di basi e svolgere un ruolo chiave nei geni di un individuo, compresi i loro rischi di patologie come il cancro. Fino ad oggi identificare queste varianti è stato difficile da fare con un solo genoma di riferimento principale.

Il Pangenoma è ora al servizio delle diagnosi precoci di diverse patologie.

Conclusioni e prospettive future

Questo è solo l’inizio del nuovo progetto che presente delle buone prospettive per la diagnosi di diverse patologie. La prima bozza, come riportato precedentemente, contiene solo informazioni genetiche di 47 individui. L’Human Pangenome Reference Consortium prevede di aumentare le informazioni fino a 350 individui nella versione finale, prevista entro la metà del 2024.

Published by
Maddalena Ranzato