La prima mappatura del genoma umano risale al 2001 e lascia delle lacune corrispondenti a circa l’8% del genoma. L’attuale genoma di riferimento è stato rilasciato dal Telomere-to-Telomere (T2T) Consortium, che si è unito ai ricercatori di diverse istituzioni accademiche e al National Institutes of Health (NIH) negli Stati Uniti. In questa versione si sono colmate le lacune della precedente e quindi risulta possibile, ad oggi, leggere il DNA umano integralmente.
Il genoma è il patrimonio genetico che compone non solo l’essere umano, ma ogni organismo vivente. Le informazioni genetiche risiedono nella sequenza di DNA. Questa presenta una disposizione lineare di nucleotidi o basi ed è l’insieme dei geni presenti nei cromosomi delle cellule dell’organismo. I geni sono l’unità funzionale del genoma, sono una sequenza di DNA che codifica una specifica proteina. Il genoma di una persona contiene tutto il suo materiale genetico trasportato dal DNA situato sulle 23 coppie di cromosomi ereditati dai suoi genitori biologici, quindi è diverso per ogni individuo.
Ventuno anni fa, due versioni iniziali di una sequenza genomica umana sono state pubblicate da Celera Genomics e dal Progetto Genoma Umano. Tuttavia, le tecnologie di sequenziamento non erano ancora in grado di decodificare le lunghe sequenze che compongono il DNA. Per questa ragione non potevano leggere più di 1000 basi per volta (il nostro DNA ne ha circa 3 miliardi). Per questo le due versioni iniziali erano incomplete e piene di errori e milioni di basi sono rimaste sconosciute.
Come detto in precedenza risultava mappato circa il 92%. Il resto delle sequenze, l’8% mancante, era di natura complessa e richiedeva una tecnologia che all’epoca non era disponibile, pertanto risultava illeggibile.
Lo sforzo che ha portato a questo nuovo gruppo di riferimento del genoma umano chiamato T2T-CHM13, è stato recentemente pubblicato su Science insieme a 5 articoli complementari che iniziano a esplorare le implicazioni biologiche dei nuovi dati. Questi progetti includono la costruzione di una mappa completa dell’epigenoma, nonché l’utilizzo di T2T-CHM13 per studiare la variabilità genetica che potrebbe essere rilevante per le malattie e la loro epidemiologia.
Dagli studi attuali è emerso che la porzione di genoma che era illeggibile nel 2001 conteneva sequenze di DNA altamente ripetitive che risultano essere quelle che sono tipicamente più variabili e mutevoli. Gli scienziati si aspettano quindi che i nuovi dati di sequenza contribuiscano a far progredire la nostra comprensione dell’evoluzione e più nel dettaglio della specie umana, incluso lo sviluppo di funzioni cognitive superiori.
La versione completa della mappa è costituita da 3.055 miliardi di coppie di basi e 19.969 geni che codificano le proteine. Di questi geni, i ricercatori ne hanno individuati circa 2.000 nuovi. La maggior parte è disattivata, ma 115 potrebbero essere ancora attivi. Gli scienziati hanno inoltre identificato circa 2 milioni di varianti genetiche supplementari, 622 delle quali erano presenti in geni clinicamente rilevanti.
Questo risultato ottenuto sul genoma umano può ora servire come modello per il sequenziamento dei genomi di persone diverse a livello globale, un obiettivo che i ricercatori stanno perseguendo.
I campioni utilizzati per stabilire il nuovo genoma umano di riferimento sono stati derivati da una talpa (o mola) idatiforme completa, un tipo di gravidanza non vitale che contiene due serie identiche di cromosomi del padre, tra cui un cromosoma X ma nessun cromosoma Y. I ricercatori del team Human Pangenome prevedono di sequenziare un totale di 350 ulteriori genomi da persone di diverse altezze, che si aggiungeranno alle sequenze di riferimento disponibili. Sono necessari ulteriori lavori per completare la sequenza completa del cromosoma Y, che non era contenuta nelle cellule utilizzate per questo studio.
Con il completamento della mappa secondo gli esperti diventerà più facile fare passi in avanti nella medicina personalizzata, con la diagnosi di malattie finora impossibili da riconoscere, nella genetica delle popolazioni e nella possibilità di riscrivere il DNA.
Articolo a cura di Maddalena Ranzato