https://frosthead.com

Il lavoro sta solo iniziando a comprendere il genoma umano

Un decennio fa, un team di ricerca internazionale ha completato un ambizioso sforzo di leggere i 3 miliardi di lettere di informazioni genetiche presenti in ogni cellula umana. Il programma, noto come Human Genome Project, ha fornito il progetto per la vita umana, un risultato che è stato paragonato all'atterraggio di un uomo sulla luna.

Il Dr. Eric D. Green è stato coinvolto fin dall'inizio, perfezionando alcune delle tecnologie chiave utilizzate nel progetto. A quel tempo, era un postdottorato e un residente in patologia presso la Washington University di St. Louis. Ha estratto il suo 5 percento del genoma, concentrandosi sulla mappatura del DNA del cromosoma 7. Oggi Green è il direttore del National Human Genome Research Institute, che promuove la comprensione del genoma umano attraverso la ricerca genomica.

Ritorniamo dalla metà alla fine degli anni '80, quando l'idea del Progetto genoma umano è stata concepita per la prima volta. Qual è stata la motivazione al momento?

Dipende da chi chiedi. Diverse persone avevano motivazioni diverse. Tieni presente che gli anni '70 e l'inizio degli anni '80 furono l'era della rivoluzione della biologia molecolare. Ci sono stati progressi significativi nei metodi che ci hanno permesso di isolare e studiare il DNA in laboratorio.

Negli Stati Uniti, ad esempio, il Dipartimento dell'Energia si è molto interessato all'idea di studiare il genoma a causa dell'interesse per la mutazione e del processo di mutazione associato ad alcune forme di energia, come l'energia nucleare.

Se vai in posti come il National Institutes of Health, o guardi i ricercatori biomedici e i ricercatori legati alla salute, erano molto interessati a essere in grado di chiarire le basi genetiche della malattia. Tra le molte malattie genetiche prese in considerazione, ovviamente, c'era il cancro.

Molte altre persone nello spettro della ricerca biomedica - anche quelle che lavorano su organismi modello, come mosche, vermi e lieviti - hanno riconosciuto che se potessimo capire come guardare in modo completo genomi complessi, iniziando con mosche e vermi e lieviti ma poi lavorando verso gli umani, fornirebbe informazioni di base per capire come funzionava il genoma.

C'era una coalizione di molte idee diverse che, con lo sfondo di progressi tecnologici incrementali ma importanti, faceva sembrare che, sebbene scoraggiante, il problema di sequenziare il genoma umano e determinare l'ordine di 3 miliardi di lettere era fattibile.

Da dove proviene il materiale per il progetto genoma? Di chi era il genoma?

Quando il progetto del genoma è iniziato, era ancora piuttosto frammentario. Diverse persone stavano realizzando diverse raccolte e frammenti di DNA chiamati librerie, che sono solo pezzi di DNA clonato. Lo farebbero da chiunque: a volte sarebbe la testa del laboratorio, a volte sarebbe il postdottorato o lo studente laureato. Avrebbero semplicemente catturato il DNA all'epoca, quando in realtà non c'erano implicazioni.

Ma poi, quando finalmente arrivò il momento di creare le biblioteche che sarebbero state usate per sequenziare il genoma umano dall'Human Genome Project, la persona che era la persona migliore per creare quelle biblioteche era uno scienziato che lavorava al Roswell Park Cancer Institute a Buffalo, New York. [Il team] ha ottenuto il consenso informato da circa 10 o 20 donatori di sangue anonimi, quindi ne ha scelto uno a caso, e quella era la persona. Circa il 60 percento della sequenza del genoma umano generata dall'Human Genome Project proveniva da un donatore di sangue a Buffalo, New York.

Ma sai una cosa, non importa. Se attraversi la sequenza del genoma umano generata dal Progetto genoma umano, è come un mosaico. Puoi andare per centomila lettere e potrebbe essere quella persona, di Buffalo. Potrebbe finire per essere il prossimo centomila e sarà qualcun altro. E i prossimi centomila, qualcun altro. Tutto ciò che serviva era un riferimento. E poiché tutti gli umani sono identici al 99, 9 per cento a livello di sequenza, quella prima sequenza non deve essere una persona reale. Può essere solo un riferimento ipotetico di una persona.

Di tutte queste informazioni, perché hai scelto di concentrarti sul cromosoma 7 [il genoma umano ha 23 cromosomi]?

Era in qualche modo arbitrario. Volevamo scegliere un cromosoma che non fosse troppo grande. Non volevamo sceglierne uno troppo piccolo. Sapevamo che ci sarebbe stato molto lavoro, quindi abbiamo scelto un cromosoma di medie dimensioni.

Non volevamo sceglierne uno con molte persone che ci lavoravano già. A quel punto, il gene più famoso sul cromosoma 7 era il gene della fibrosi cistica, scoperto nel 1989. E in realtà avevamo isolato parte di quella regione e stavamo facendo alcuni studi in modo pilota.

La verità è che l'abbiamo scelto perché non era troppo grande, non era troppo piccolo e non era troppo affollato. Era un modo arbitrario di iniziare; al termine del progetto sul genoma, la maggior parte degli studi erano stati condotti su tutto il genoma.

Come è cambiato il lavoro nel corso della vita del progetto?

L'intera storia della genomica è una storia di sviluppo tecnologico. Se rintracci dove sono stati fatti gli enormi progressi, ognuno di essi è stato associato a picchi di tecnologia. All'inizio del progetto sul genoma, è emerso che avevamo modi migliori per isolare grossi pezzi di DNA.

Quando abbiamo sequenziato i genomi di piccoli organismi - come i moscerini della frutta della Drosophila - abbiamo sostanzialmente industrializzato il processo di sequenziamento, rendendolo sempre più automatizzato.

Quando iniziò il progetto sul genoma, l'idea era: "Mettiamo in sequenza i genomi di mosche, vermi e lieviti, tutti questi organismi più piccoli, usando il metodo del giorno", che era questo metodo sviluppato da Fred Sanger nel 1977. L'idea era che non spingerebbe l'acceleratore per iniziare il sequenziamento del genoma umano fino a quando non sarà disponibile un nuovo rivoluzionario metodo di sequenziamento. Quindi ci sono stati molti sforzi per sviluppare nuovi modi folli di sequenziare il DNA.

Quando arrivò il momento, verso il 1997 o il 1998, di pensare davvero a iniziare a sequenziare il genoma umano, tutti dissero: “Forse non abbiamo bisogno di aspettare un metodo rivoluzionario, forse abbiamo migliorato gradualmente il metodo vecchio stile abbastanza da poter essere usato ”, ed è proprio quello che è stato deciso.

Detto questo, dal progetto del genoma, la cosa che ha cambiato il volto della genomica sono state le nuove rivoluzionarie tecnologie di sequenziamento che sono finalmente apparse sulla scena intorno al 2005.

In che modo questi miglioramenti hanno cambiato il costo e i tempi necessari per il sequenziamento?

Il Progetto genoma umano ha richiesto da sei a otto anni di sequenziamento attivo e, in termini di sequenziamento attivo, hanno speso circa un miliardo di dollari per produrre la prima sequenza di genoma umano. Il giorno in cui è terminato il progetto sul genoma, abbiamo chiesto ai nostri gruppi di sequenziamento: "Va bene, se avessi intenzione di mettere in sequenza un secondo genoma umano, ipoteticamente, quanto tempo ci vorrebbe e quanto costerebbe?" calcolo, dissero, "Wow, se ci dai altri 10-50 milioni di dollari, probabilmente potremmo farlo in tre o quattro mesi".

Ma ora, se vai dove siamo oggi, puoi sequenziare un genoma umano in circa un giorno o due. Entro la fine di quest'anno, sarà circa un giorno. E costerà solo circa $ 3.000 a $ 5.000 dollari.

Quali sono stati i principali risultati del primo genoma e quelli che seguirono?

Ci sono nuove scoperte che arrivano ogni giorno. Nei primi 10 anni in cui abbiamo davanti a noi la sequenza del genoma umano, penso che, giorno per giorno, accumuliamo sempre più informazioni su come funziona il genoma umano. Ma dovremmo riconoscere che anche tra 10 anni, siamo solo nelle prime fasi dell'interpretazione di quella sequenza. Da decenni continueremo a interpretare e reinterpretare.

Alcune delle prime cose che abbiamo imparato, ad esempio: abbiamo molti meno geni di quanto alcune persone avessero previsto. Quando iniziò il genoma, molte persone predissero che gli umani probabilmente avevano 100.000 geni e avrebbero avuto sostanzialmente più geni di altri organismi, in particolare di organismi più semplici. Si scopre che non è vero. Si scopre che siamo un numero di geni molto più basso. In effetti, probabilmente siamo più simili a 20.000 geni. E questo è solo poche migliaia in più di mosche e vermi. Quindi la nostra complessità non è nel nostro numero di geni. La nostra complessità è altrove.

L'altra sorpresa è arrivata quando abbiamo iniziato a sequenziare altri mammiferi, in particolare il genoma del topo, il genoma del ratto, il genoma del cane e così via, e ormai abbiamo sequenziato 50, 60, 70 tali genomi. Allini le sequenze del genoma in un computer e cerchi di vedere dove sono sequenze molto conservate, in altre parole attraverso decine di milioni di anni di tempo evolutivo, dove le sequenze non sono affatto cambiate. Sequenze altamente evolute e altamente evolutive indicano quasi sicuramente sequenze funzionali. Queste sono cose che la vita non vuole cambiare e quindi le mantengono uguali perché stanno svolgendo alcune funzioni fondamentali vitali necessarie per la biologia. Entrando nel progetto del genoma, abbiamo pensato che la maggior parte delle regioni più conservate che erano funzionalmente importanti sarebbero state nei geni, le parti del genoma che codificano direttamente per le proteine. Si scopre che la maggior parte delle sequenze più altamente conservate e inevitabilmente funzionali non si trovano in regioni codificanti per proteine; sono al di fuori dei geni.

Quindi cosa stanno facendo? Non li conosciamo tutti. Ma sappiamo che molti di loro sono fondamentalmente interruttori di circuito, come interruttori dimmer per una luce, che determinano dove, quando e quanto si accende un gene. È molto più complicato nell'uomo che negli organismi inferiori come mosche e vermi. Quindi la nostra complessità biologica non è tanto nel nostro numero di geni. È negli interruttori complessi, come gli interruttori dimmer, che regolano dove, quando e quanti geni si attivano.

Cosa ci resta da capire?

Quando pensi a come funziona il genoma, quello sta pensando a come funziona comunemente per tutti noi. Ma l'altra grande enfasi sulla genomica - specialmente negli ultimi 10 anni - è capire come i nostri genomi sono diversi. Quindi lì puoi enfatizzare lo 0, 1 percento dei nostri genomi che sono diversi l'uno rispetto all'altro e in che modo tali differenze portano a diversi processi biologici. Quindi lì, comprendere la variazione è molto, molto importante, e quindi correlare quella variazione a diverse conseguenze, di cui la malattia ne costituisce una parte importante.

Ci sono stati progressi notevoli, davvero notevoli. Ora conosciamo le basi genomiche di quasi 5.000 malattie genetiche rare. Quando è iniziato il progetto sul genoma, c'erano solo poche decine di malattie per le quali abbiamo capito quale fosse la mutazione che causava quella malattia. Questa è una differenza enorme. Ora conosciamo molte, molte centinaia e centinaia di regioni del genoma umano che contengono varianti — non sappiamo ancora quali varianti — che stanno dando il rischio di malattie genetiche più complicate, come ipertensione e diabete e asma, malattie cardiovascolari e così via .

Siamo passati da una completa mancanza di conoscenza di dove cercare nel genoma quelle varianti a quelle che ora hanno regioni molto discrete in cui guardare. Quindi questa è una grande enfasi ora nella genomica, sta cercando di capire quali varianti sono rilevanti per la malattia e cosa fare al riguardo.

Il lavoro sta solo iniziando a comprendere il genoma umano