La chimica del sequenziamento: passato, presente e futuro

Come molti di voi sapranno, il 2011 è stato proclamato dall’ONU l’Anno Internazionale della Chimica. La chimica è la scienza centrale, quella che più di ogni altra ha la capacità di guidare il progresso scientifico, grazie alle sue innumerevoli connessioni con la biologia, la fisica, la medicina e chi più ne ha più ne metta. Ho voluto renderle omaggio anche io, scrivendo questo post che partecipa al Carnevale della Chimica coordinato per questo mese da Anna Rita Ruberto di Scientificando.

IL DNA

Il DNA (o acido deossiribonucleico) è una molecola che ha l’aspetto di una doppia elica formata da due catene di nucleotidi. I nucleotidi sono piccole molecole costituite da un gruppo fosfato, uno zucchero (deossiribosio) e una base azotata; mentre le prime due componenti sono sempre uguali e costituiscono l’ossatura della doppia elica, le basi azotate esistono in quattro “versioni” differenti. Esse si chiamano Adenina (A), Citosina (C), Guanina (G) e Timina (T), e godono di una proprietà importante: la complementarietà. In una molecola di DNA, una A si troverà sempre davanti a una T, così come una C si troverà sempre davanti a una G: questo significa che per leggere una sequenza di DNA non è necessario sequenziare entrambi i filamenti, basta avere uno dei due e quello complementare si potrà ricavare facilmente. E’ proprio sfruttando la proprietà della complementarietà che la DNA polimerasi riesce a replicare le molecole di DNA nel momento in cui è necessario, e cioè quando la cellula deve dividersi per generare due cellule figlie con identico patrimonio genetico: utilizzando un filamento come stampo e un piccolo tratto di DNA come innesco, questo enzima è in grado di sintetizzare l’altro filamento legando uno dietro l’altro i nucleotidi corretti.

IL METODO SANGER

A Frederick Sanger bastò osservare la DNA polimerasi all’opera per capire come sviluppare il primo metodo per sequenziare il DNA. L’unico ingrediente che dovette aggiungere furono dei nucleotidi particolari, chiamati dideossinucleotidi: queste molecole hanno una modifica chimica tale per cui, una volta inserite nella catena nascente di DNA, ne interrompono la sintesi. La polimerasi non riesce più ad aggiungere altri nucleotidi, e rilascia così un frammento “monco”. A questo punto bisognava fare due cose: misurare la lunghezza di questo frammento e riconoscere il dideossinucleotide che si era legato per ultimo. Con queste due informazioni in mano leggere la sequenza è immediato: se ho ottenuto un frammento lungo 10 nucleotidi dove l’ultimo nucleotide aggiunto è una G, io so che in 10° posizione c’è una G. Un tempo per fare questo si eseguivano sullo stesso DNA quattro reazioni separate, per ognuna delle quali si utilizzava un dideossinucleotide diverso: ddATP, ddCTP, ddGTP e ddTTP. Al termine della reazione, si prendevano i frammenti generati da ogni reazione e li si misurava mediante un’elettroforesi su gel: in questo gel, le molecole più lunghe si muovono più lentamente e tutti i frammenti possono quindi essere separati. Al termine, si ricostruiva la sequenza. Con l’avvento dei sequenziatori automatici, si è iniziato a fare tutto in un’unica miscela di reazione, etichettando ogni base azotata con una molecola fluorescente di colore diverso; inoltre, i frammenti si separano in tubi capillari, con un lettore ottico che registra il colore emesso dal DNA al suo passaggio.

L’invenzione di questo metodo di sequenziamento ha segnato una svolta epocale nel campo della biologia molecolare e lo dimostra il fatto che Fred Sanger ricevette per questo motivo un premio Nobel per la Chimica nel 1980. Tuttavia, occorre molto tempo per sequenziare in questo modo lunghi tratti di DNA: per leggere un intero genoma umano sarebbero necessari più di tre anni di lavoro! Inoltre, è una tecnica molto costosa: si spendono 10 centesimi di dollaro ogni mille basi. Per questi motivi si è passati ora a tecnologie di sequenziamento molto più efficienti ed economiche, le cosiddette tecnologie di seconda generazione.

MONTAGNE DI DATI

Le nuove macchine iniziarono a popolare il mercato dal 2005 in poi, offrendo costi minori e soprattutto enormi quantità di sequenze, vere e proprie montagne di dati che per un sequenziatore Sanger erano inimmaginabili. A farsi concorrenza c’erano diverse aziende, ma a spuntarla fu Illumina/Solexa, che conquistò rapidamente il ruolo di leader nel settore del sequenziamento genomico. I suoi sequenziatori sfruttavano ancora la DNA polimerasi come nella tecnologia precedente, ma introducevano due accorgimenti tecnici che facevano la differenza. Il primo è l’immobilizzazione del DNA su un supporto fisso: le molecole da sequenziare sono infatti incollate a un vetrino tramite degli adattatori. Questo permette di leggere milioni di frammenti di DNA contemporaneamente, perché ciascuno di essi viene a trovarsi in un punto preciso e non si può confondere con gli altri. La seconda, importantissima novità sono i terminatori reversibili. Nel metodo Sanger i nucleotidi modificati bloccavano la sintesi del DNA in modo irreversibile, mentre quelli di Illumina possono essere riattivati, grazie all’azione di un enzima che taglia via la parte di molecola che blocca il lavoro della DNA polimerasi. In questo modo, è possibile monitorare in tempo reale l’aggiunta di tutti i nucleotidi su ogni frammento, fotografando le fluorescenze emesse a ogni passaggio da tutte le molecole di DNA depositate sul vetrino.

I due grandi rivali di Solexa/Illumina erano, e sono tuttora, ABI/Solid e Roche/454. Le loro tecnologie sono molto diverse, e la prima grossa differenza è che entrambe queste aziende hanno scelto di immobilizzare le molecole di DNA non su un supporto solido, ma su delle piccole sfere, a loro volta poste su un vetrino. ABI/SOLiD ha persino abbandonato la DNA polimerasi per passare a un altro enzima, la DNA ligasi, che unisce frammenti di DNA anziché sintetizzarne di nuovi. Inoltre, ha elaborato un sistema di sequenziamento che consente di leggere due volte lo stesso nucleotide, il che abbassa di molto la possibilità di commettere errori.

Roche/454, dal canto suo, non utilizza più i nucleotidi fluorescenti, ma sfrutta un prodotto di scarto della polimerasi (il pirofosfato inorganico PPi) per generare dei flash di luce ogni volta che un nucleotide nuovo viene aggiunto. Il trucco è dare il PPi in pasto a una sulfurilasi, un enzima che lo utilizza per generare una molecola di ATP; a sua volta, l’ATP viene prelevato da una luciferasi che lo usa per ossidare una luciferina e produrre un segnale luminoso. Poiché questo segnale è sempre uguale per tutti i nucleotidi, essi devono essere immessi nel sistema un tipo alla volta: prima le A, poi le C e così via.

Gli incredibili progressi tecnologici e l’utilizzo di nuove chimiche di sequenziamento hanno permesso di fare grandi scoperte scientifiche sul nostro genoma, scoperte che presto ci saranno utili per avere cure personalizzate in base al nostro profilo genetico. Il bello, però, deve ancora arrivare. E arriverà con i sequenziatori di terza generazione, che pur essendo poco più che prototipi, promettono già grandissime cose.

IL SEQUENZIAMENTO DEL FUTURO

I prossimi anni vedranno sicuramente una nuova rivoluzione nel campo del sequenziamento, ma ancora non è chiaro se a portarla saranno macchine sempre più costose e potenti o piccoli strumenti low-cost grandi come una stampante, capaci di entrare con più facilità nella pratica medica di routine.

La prima strada è quella scelta da Pacific Biosciences, che sta mettendo a punto un sequenziatore mostruoso da 700mila dollari. Il suo punto di forza è essenzialmente uno solo: la capacità di sequenziare singole molecole di DNA. Nelle tecnologie precedenti, infatti, bisognava moltiplicare i frammenti per avere gruppi di molecole tutte uguali da sequenziare: solo così il segnale fluorescente era sufficientemente potente per poter essere visualizzabile dal lettore ottico. Riuscire a leggere una singola molecola di DNA, monitorando in tempo reale l’aggiunta dei nucleotidi, significa poter usare piccole quantità di DNA e risparmiare moltissimi soldi sui reagenti.

Altre due compagnie, invece, hanno deciso di abbandonare del tutto molecole fluorescenti e costosissimi lettori ottici. Ion Torrent ha messo in vendita un sequenziatore piccolissimo, che costa un decimo di quello di Pacific Biosciences: la sua peculiarità è che registra gli inserimenti dei nucleotidi misurando le variazioni di pH durante il sequenziamento.

Oxford Nanopore, al contrario, dice di essere in grado di leggere una sequenza di DNA basandosi sui cambiamenti nel flusso di corrente che attraversa dei fori di pochi nanometri, cambiamenti che sono caratteristici dello specifico nucleotide che viene aggiunto alla catena.

Il costo per sequenziare un genoma umano è diminuito di un milione di volte in dieci anni, e forse presto taglieremo il traguardo dei mille dollari. Arriverà il giorno in cui ci presenteremo dal nostro medico di fiducia con una chiavetta USB contenente i nostri dati genetici: grazie a queste informazioni conosceremo i farmaci più efficaci per noi e lo stile di vita che ci aiuterà a restare sani più a lungo. Non sappiamo quando entreremo veramente nell’era della medicina genomica, ma quando quel momento arriverà, il merito sarà anche degli incredibili progressi fatti negli ultimi anni dalla chimica del sequenziamento, un’altra delle infinite declinazioni della scienza di tutte le scienze, la Scienza Centrale.

Annunci

Haiti, il colera viene dall’Asia [Galileo]

Grazie alle tecnologie di sequenziamento di terza generazione è stato possibile scoprire l’origine dell’epidemia di colera che sta colpendo Haiti. Del sequenziamento del ceppo di Vibrio cholerae si è infatti occupata la Pacific Biosciences, la cui tecnologia è stata recentemente premiata dal magazine The Scientist come l’invenzione dell’anno. I tecnici dell’azienda americana hanno decodificato i 4,5 milioni di nucleotidi che compongono la sequenza genomica dell’agente patogeno a tempo di record.

Il ceppo di colera che sta mettendo in ginocchio Haiti è arrivato dall’Asia. Lo ha scoperto un team di ricercatori guidati da Matthew Waldor della Harvard Medical School (Boston, USA) che ha pubblicato i risultati del proprio studio sul New England Journal of Medicine.

Da quando sono stati segnalati i primi casi a metà ottobre, il colera ha fatto più di 2.000 vittime ad Haiti e l’Organizzazione Mondiale della Sanità (OMS) prevede che l’epidemia possa durare più di un anno. Ciò che, fin dall’inizio, ha lasciato perplessi gli esperti è come abbia fatto questa malattia ad arrivare sulla piccola isola caraibica dopo più di un secolo di assenza.

Per trovare una risposta a questo interrogativo, i ricercatori hanno isolato il ceppo specifico del batterio che sta provocando l’epidemia (Vibrio cholerae) e ne hanno sequenziato il genoma con una tecnologia di ultima generazione. In meno di quattro giorni, i tecnici californiani hanno decodificato la sequenza genetica dell’agente patogeno, e hanno scoperto una notevole somiglianza con il Vibrio cholerae dell’Asia meridionale. La malattia non si è quindi originata dall’America Latina, come sostenuto da alcuni studiosi, ma è stata probabilmente portata ad Haiti da un viaggiatore proveniente dall’Estremo Oriente.

L’analisi bioinformatica ha permesso anche di caratterizzare il gene che produce la tossina responsabile dei sintomi della malattia, scoprendo che quello haitiano è un ceppo più aggressivo e virulento rispetto alla norma. La stessa analisi del DNA del batterio, però, ha rivelato una suscettibilità a particolari antibiotici, le tetracicline, che quindi potranno essere impiegati sull’isola per arginare l’epidemia.

Chin CS et al. “The Origin of the Haitian Cholera Outbreak Strain” New England Journal of Medicine, published online 9 December 2010

Next-next-generation sequencing: i nuovi protagonisti

dna-sequencing

David Munroe e Timothy Harris hanno pubblicato sull’ultimo numero di Nature Biotechnology un interessante articolo sulle nuove tecnologie di sequenziamento presentate al meeting Advances in Genome Biology and Technology (AGBT), tenutosi a Marco Island (Florida) dal 24 al 27 Febbraio scorsi.

Illumina e Life Technologies stanno lavorando duramente sulle loro macchine più recenti (HiSeq 2000 e SOLiD 4) e promettono di arrivare entro la fine dell’anno a livelli di throughput straordinari, oltre che a una maggiore automatizzazione nella preparazione dei campioni. Nel 2009, a queste due grandi aziende si è aggiunta la Complete Genomics, che ha sviluppato un sistema proprietario piuttosto complesso basato sulla ligazione e che ha scelto un modello di business differente, puntando sul servizio di sequenziamento piuttosto che sulla vendita delle macchine.

Benché eccellenti, queste piattaforme si basano comunque su tecnologie di seconda generazione. Molto più entusiasmo hanno suscitato all’AGBT le aziende definite di terza generazione, che stanno inventandosi nuove strategie di sequenziamento caratterizzate da templati a singola molecola. Queste tecniche potranno vantare costi e tempi ridotti, oltre a una preparazione dei campioni e un’analisi dati semplificate. Usare una singola molecola di DNA come templato ridurrà la quantità di materiale necessario, mentre i tempi di sequenziamento ridotti (minuti e non più giorni) potrà consentire l’utilizzo di queste tecnologie nella diagnostica di routine.

Le principali protagoniste di questa nuova fase sono Pacific Biosciences, Life Technologies, Oxford Nanopore e Ion Torrent. Le prime due utilizzano DNA polimerasi e nucleotidi marcati, e producono reads molto lunghe (1000-1500 basi) in tempi brevi (15-20 minuti per corsa). Inoltre, entrambe le aziende hanno sviluppato un sistema che consente alla polimerasi di non venire danneggiata dalla continua stimolazione luminosa del laser di eccitazione, come invece accade per le tecnologie di seconda generazione.

Oxford Nanopore e Ion Torrent sono più innovative, ma più lontane dal lancio commerciale dei loro strumenti. Nel primo caso il sequenziamento avviene ad opera di una esonucleasi che stacca dalla molecola di DNA una singola base, la quale entrando in un nanoporo va a disturbare la corrente elettrica che lo attraversa in un modo caratteristico della specifica base azotata. La Ion Torrent utilizza ancora la DNA polimerasi, ma invece di un segnale luminoso va a misurare gli ioni idrogeno rilasciati durante la reazione di elongazione della molecola di DNA. Nessuna delle due tecnologie fa uso di nucleotidi marcati e di costosi sistemi di rilevazione ottica, il che le rende molto più economiche.

Ci troviamo in un’epoca splendida per la genomica. Numerose società stanno investendo risorse ingenti per produrre sequenziatori sempre più potenti e sempre meno costosi: tutto lascia pensare che presto l’analisi del DNA entrerà a far parte della nostra vita di tutti i giorni.

Munroe DJ et al “Third-generation sequencing fireworks at Marco Island” Nature Biotechnology 2010, 28(5): 426-428

Grandi novità per l’epigenomica

La complessità dei genomi non si ferma alla difficoltà nel leggere e comprendere la sequenza nucleotidica che li contraddistingue; esistono infatti delle modifiche chimiche che, pur lasciando invariato il codice genetico, sono in grado di aumentare o diminuire l’espressione di un tratto di DNA. Queste modifiche, studiate dalla epigenomica, rivestono un ruolo fondamentale nei processi di sviluppo negli organismi e sono state spesso associate al cancro e ad altre patologie. A dispetto della loro rilevanza, riuscire a individuare queste modifiche in una sequenza nucleotidica non è stato finora un compito facile, o quantomeno non così semplice come produrre le sequenze stesse con i sequenziatori di nuova generazione.

La metilazione delle basi azotate Citosina e Adenina è la modificazione epigenetica di maggiore interesse e fino ad oggi è stato possibile studiarla principalmente trattando il DNA con il bisolfito. Questo procedimento converte le citosine non metilate in uracile, lasciando intatte quelle metilate: in questo modo è possibile discriminare in seguito a sequenziamento l’una e l’altro tipo di citosina. Purtroppo si tratta di un metodo costosissimo: produrre una mappa di metilazione per un singolo genoma umano verrebbe a costare qualcosa come 100 mila dollari. Non solo, in seguito al trattamento con bisolfito il DNA può subire dei danni, rendendo quindi meno accurata la sequenza nucleotidica che poi verrà letta.

In soccorso degli studiosi di epigenomica è arrivata la Pacific Biosciences, che ha pubblicato su Nature Methods la dimostrazione che, utilizzando il suo metodo di sequenziamento SMRT (Single-Molecule Real-Time sequencing), è possibile riconoscere citosine e adenine metilate durante la stessa procedura di sequenziamento. Infatti, sembra che la presenza di una metilazione influisca sui tempi di emissione dell’impulso luminoso che consente alla macchina di distinguere le diverse basi azotate.

Gli stessi autori ammettono che la tecnica deve ancora essere perfezionata (le citosine metilate sono più difficili da riconoscere rispetto alle adenine), ma il solo fatto che il costo di una mappa di metilazione potrebbe precipitare a poche centinaia di dollari è già di per sè sufficiente a entusiasmare i ricercatori e ovviamente la Pacific Biosciences.

BA Flusberg et al “Direct detection of DNA methylation during single-molecule, real-time sequencing” Nature Methods, published online 9 may 2010