Genomica hi-tech: Oxford Nanopore presenta il primo sequenziatore usa e getta

La genomica non finisce mai di stupire, soprattutto quando si parla di nuove tecnologie. Tutti ci aspettavamo grandi novità dal meeting AGBT di Marco Island, in Florida, ma sinceramente credo che nessuno si aspettasse di assistere alla presentazione di un sequenziatore di DNA USB. Sì, avete capito bene. L’azienda inglese Oxford Nanopore ha annunciato che nei prossimi mesi metterà in vendita un sequenziatore usa e getta poco più grande di una chiavetta USB, che collegato a un pc portatile potrà sequenziare del materiale genetico e in tempo reale trasmettere i dati a un software installato sul computer. L’ultimo prodigio della tecnologia genomica si chiama MinION, e nel weekend appena trascorso non si è parlato d’altro: ne hanno tessuto le lodi Nature, Forbes, Bio-IT World, New Scientist oltre a diversi blog specialistici.

Oxford Nanopore era rimasta stranamente silenziosa negli ultimi tempi, al contrario di altre aziende concorrenti che invece facevano proclami da prima pagina. Oggi però non ce n’è per nessuno: sì, perché oltre al MinION, la società inglese guidata da Clive Brown ha in serbo il GridION, che è un po’ il fratello maggiore del mini sequenziatore USB. Le specifiche tecniche di entrambi gli strumenti sono impressionanti per almeno tre motivi. Il primo è che la tecnologia di Oxford Nanopore consente di leggere sequenze di DNA lunghissime, fino a 100mila nucleotidi: il team britannico è riuscito a sequenziare il genoma del virus Phi X, che è lungo 5400 nucleotidi, con una sola lettura senza interruzioni. Il secondo punto di forza dei sequenziatori di Oxford Nanopore è la semplicità nella preparazione del campione, un vantaggio notevole rispetto alle altre tecnologie attualmente sul mercato (non è nemmeno necessario amplificare il DNA). Infine, non bisogna dimenticare che queste macchine sono in grado di riconoscere anche le modificazioni epigenetiche del DNA.

I due sequenziatori sono stati concepiti per usi differenti. MinION si presta molto bene per sequenziare in tempi rapidissimi genomi batterici o virali, oppure per caratterizzare campioni di tessuti tumorali. Avrà infatti una produttività limitata (150 milioni di basi all’ora per un massimo di sei ore), ma sufficiente per applicazioni nella diagnostica, nelle analisi forensi o in campo ecologico. GridION finirà sicuramente nei grossi centri di sequenziamento, che potranno sfruttare la sua scalabilità: più sequenziatori possono infatti essere collegati insieme, e lavorare in parallelo. Per quanto riguarda i prezzi, MinION sarà usa e getta e costerà dai 500 ai 900 dollari. GridION invece non ha ancora un prezzo, ma secondo i produttori leggere un miliardo di basi di DNA costerà meno di 10 dollari. L’unica cosa su cui Oxford Nanopore deve ancora lavorare è l’accuratezza della lettura: al momento il tasso di errore è del 4%, ma quando i sequenziatori arriveranno sul mercato nella seconda metà del 2012 questa percentuale sarà scesa sotto l’1%.

L’idea di sequenziare il DNA facendolo passare attraverso dei pori di pochi nanometri circola nell’ambiente dagli anni 90, ma MinION e GridION sono i primi strumenti che mettono finalmente in pratica questa idea. Ovviamente gli unici a non essere entusiasti di questo annuncio sono le aziende rivali, specialmente Life Technologies e Illumina: la prima teme che il suo mirabolante Ion Proton presentato poche settimane fa sia già stato dimenticato, la seconda invece assiste con disappunto all’ingresso sul mercato di un nuovo agguerritissimo concorrente, che ambisce a portarle via la quota di mercato che si era faticosamente conquistata negli ultimi cinque anni. Le due società hanno accusato il colpo, lo dimostrano il -6% e il -3% che hanno registrato le loro azioni in borsa in seguito all’annuncio di Oxford Nanopore.

Stiamo assistendo a una nuova rivoluzione nel campo del sequenziamento genomico dopo quella del 2005, e curiosamente i protagonisti sono sempre gli stessi. Il primo è l’attuale CEO di Ion Torrent, Jonathan Rothberg, il secondo è il CTO di Oxford Nanopore, Clive Brown. Qualche anno fa Rothberg inventava la tecnologia 454, che segnava la fine dell’era Sanger e apriva la strada ai sequenziatori di seconda generazione. Brown, invece, lavorava per Solexa/Illumina, azienda che oggi domina quel mercato inaugurato proprio dall’invenzione di Rothberg. Oggi, a distanza di pochi anni, il duello si ripropone: ancora una volta è stato Rothberg a fare la prima mossa, presentando il primo sequenziatore in grado di leggere un genoma umano per soli mille dollari. Ma anche questa volta Rothberg rischia di essere beffato, e sempre per colpa di Clive Brown.

Galaxy Cloud: la bioinformatica a portata di click

ResearchBlogging.orgLe tecnologie per il sequenziamento genomico sono migliorate in modo impressionante negli ultimi anni, è un fatto ormai noto a chiunque lavori in ambito scientifico: si è passati dal metodo Sanger al sequenziamento di seconda generazione e infine, proprio in questi mesi, alle macchine di terza generazione. Le specifiche tecniche sono strabilianti, è possibile ottenere in poco tempo e a basso costo una sequenza genomica di qualità elevatissima. L’aspetto che molti si dimenticano spesso di sottolineare, però, è che a questa enorme produzione di dati non corrisponde un’altrettanto straordinaria capacità di immagazzinarli, e soprattutto di analizzarli.

Con il crollo dei costi, sempre più laboratori – anche di piccole dimensioni – decidono di acquistare un sequenziatore di DNA per produrre in casa i dati, ma quando arriva il momento di dare a queste sequenze un significato biologico iniziano i problemi. Il primo problema è il software: la tecnologia cambia rapidamente, le esigenze di analisi sono differenti e non sempre esiste un programma bell’e pronto che consenta di eseguire l’analisi richiesta agevolmente. Molto spesso i bioinformatici sono costretti a setacciare la rete alla ricerca del software giusto, poi devono ottimizzarlo per lo specifico lavoro da svolgere e infine perdere tempo a modificare il formato dei propri file affinché siano “digeribili” dal programma. Per non parlare di quando non esiste nessun software che esegua l’analisi che vi interessa nel modo in cui serve a voi, con il tipo di organismo che serve a voi e la tipologia di dati che voi avete a disposizione: in quel caso il bioinformatico sfodera le sue competenze di programmatore e si fabbrica da solo il tool tanto desiderato. Insomma, se pensate che per analizzare una sequenza genomica basti premere un pulsante sulla tastiera del vostro portatile, vi sbagliate di grosso.

Il secondo scoglio in cui ci si imbatte quando si devono analizzare dati genomici è l’hardware. E’ una questione molto seria, specialmente quando la deve affrontare un piccolo laboratorio, che certamente non ha a disposizione infrastrutture informatiche fantascientifiche. Lo spazio occupato da questo tipo di dati è nell’ordine dei terabyte (1 tera sono più o meno 1000 giga), e la potenza computazionale necessaria per analizzarli in un tempo accettabile non è quella in dotazione a un normale computer. Se si vuole fare proprio tutto da sé, quindi, è inevitabile acquistare server costosi e assicurarsi di avere personale specializzato che faccia regolare manutenzione e risolva prontamente qualsiasi problema tecnico.

Fortunatamente, c’è qualcuno che ha ben presenti tutte queste difficoltà e si sta impegnando a fondo per ridimensionare – se non eliminare – questi problemi: sono Anton Nekrutenko, professore alla Penn State University, e il suo team. Nel 2005 hanno lavorato per risolvere la questione software e hanno realizzato Galaxy, una piattaforma che raccoglie tutti i principali tool di analisi in unico sito web dall’interfaccia user-friendly. Si può scaricare il software sul proprio PC oppure lanciare le analisi sui computer dell’università americana. E’ gratis e può contare su una comunità di sviluppatori che aggiunge continuamente nuove funzionalità. Ora il team di Nekrutenko fa un altro salto di qualità, portando Galaxy nel mondo del cloud computing. I vantaggi sono notevoli: le risorse computazionali a disposizione del singolo utente diventano pressoché illimitate, e si ha la garanzia che i propri dati siano conservati in un luogo sicuro.

“Galaxy Cloud offre molti vantaggi oltre a quelli più ovvi, come la potenza computazionale necessaria per grandi quantità di dati e la possibilità per uno scienziato con poca esperienza informatica di cimentarsi in analisi complesse, che sarebbero altrimenti inaccessibili” ha dichiarato Nekrutenko. “Ad esempio, i gruppi di ricerca non devono più investire denaro in costose infrastrutture informatiche per poter eseguire, su grandi moli di dati, analisi scientifiche sofisticate“. Un altro punto di forza è l’allocazione automatica delle risorse disponibili nel cloud, gestita dal sistema CloudMan, che rende rapide ed economiche le analisi. In una lettera a Nature Biotechnology, gli autori dimostrano che impostando la funzione autoscaling di CloudMan è possibile svolgere un’analisi nello stesso tempo (6 ore), spendendo 20 dollari invece di 50. Per usare Galaxy Cloud non avete bisogno né di grossi server, né di ingegneri informatici: tutto ciò che vi serve è il vostro browser.


Afgan, E., Baker, D., Coraor, N., Goto, H., Paul, I., Makova, K., Nekrutenko, A., & Taylor, J. (2011). Harnessing cloud computing with Galaxy Cloud Nature Biotechnology, 29 (11), 972-974 DOI: 10.1038/nbt.2028

La chimica del sequenziamento: passato, presente e futuro

Come molti di voi sapranno, il 2011 è stato proclamato dall’ONU l’Anno Internazionale della Chimica. La chimica è la scienza centrale, quella che più di ogni altra ha la capacità di guidare il progresso scientifico, grazie alle sue innumerevoli connessioni con la biologia, la fisica, la medicina e chi più ne ha più ne metta. Ho voluto renderle omaggio anche io, scrivendo questo post che partecipa al Carnevale della Chimica coordinato per questo mese da Anna Rita Ruberto di Scientificando.

IL DNA

Il DNA (o acido deossiribonucleico) è una molecola che ha l’aspetto di una doppia elica formata da due catene di nucleotidi. I nucleotidi sono piccole molecole costituite da un gruppo fosfato, uno zucchero (deossiribosio) e una base azotata; mentre le prime due componenti sono sempre uguali e costituiscono l’ossatura della doppia elica, le basi azotate esistono in quattro “versioni” differenti. Esse si chiamano Adenina (A), Citosina (C), Guanina (G) e Timina (T), e godono di una proprietà importante: la complementarietà. In una molecola di DNA, una A si troverà sempre davanti a una T, così come una C si troverà sempre davanti a una G: questo significa che per leggere una sequenza di DNA non è necessario sequenziare entrambi i filamenti, basta avere uno dei due e quello complementare si potrà ricavare facilmente. E’ proprio sfruttando la proprietà della complementarietà che la DNA polimerasi riesce a replicare le molecole di DNA nel momento in cui è necessario, e cioè quando la cellula deve dividersi per generare due cellule figlie con identico patrimonio genetico: utilizzando un filamento come stampo e un piccolo tratto di DNA come innesco, questo enzima è in grado di sintetizzare l’altro filamento legando uno dietro l’altro i nucleotidi corretti.

IL METODO SANGER

A Frederick Sanger bastò osservare la DNA polimerasi all’opera per capire come sviluppare il primo metodo per sequenziare il DNA. L’unico ingrediente che dovette aggiungere furono dei nucleotidi particolari, chiamati dideossinucleotidi: queste molecole hanno una modifica chimica tale per cui, una volta inserite nella catena nascente di DNA, ne interrompono la sintesi. La polimerasi non riesce più ad aggiungere altri nucleotidi, e rilascia così un frammento “monco”. A questo punto bisognava fare due cose: misurare la lunghezza di questo frammento e riconoscere il dideossinucleotide che si era legato per ultimo. Con queste due informazioni in mano leggere la sequenza è immediato: se ho ottenuto un frammento lungo 10 nucleotidi dove l’ultimo nucleotide aggiunto è una G, io so che in 10° posizione c’è una G. Un tempo per fare questo si eseguivano sullo stesso DNA quattro reazioni separate, per ognuna delle quali si utilizzava un dideossinucleotide diverso: ddATP, ddCTP, ddGTP e ddTTP. Al termine della reazione, si prendevano i frammenti generati da ogni reazione e li si misurava mediante un’elettroforesi su gel: in questo gel, le molecole più lunghe si muovono più lentamente e tutti i frammenti possono quindi essere separati. Al termine, si ricostruiva la sequenza. Con l’avvento dei sequenziatori automatici, si è iniziato a fare tutto in un’unica miscela di reazione, etichettando ogni base azotata con una molecola fluorescente di colore diverso; inoltre, i frammenti si separano in tubi capillari, con un lettore ottico che registra il colore emesso dal DNA al suo passaggio.

L’invenzione di questo metodo di sequenziamento ha segnato una svolta epocale nel campo della biologia molecolare e lo dimostra il fatto che Fred Sanger ricevette per questo motivo un premio Nobel per la Chimica nel 1980. Tuttavia, occorre molto tempo per sequenziare in questo modo lunghi tratti di DNA: per leggere un intero genoma umano sarebbero necessari più di tre anni di lavoro! Inoltre, è una tecnica molto costosa: si spendono 10 centesimi di dollaro ogni mille basi. Per questi motivi si è passati ora a tecnologie di sequenziamento molto più efficienti ed economiche, le cosiddette tecnologie di seconda generazione.

MONTAGNE DI DATI

Le nuove macchine iniziarono a popolare il mercato dal 2005 in poi, offrendo costi minori e soprattutto enormi quantità di sequenze, vere e proprie montagne di dati che per un sequenziatore Sanger erano inimmaginabili. A farsi concorrenza c’erano diverse aziende, ma a spuntarla fu Illumina/Solexa, che conquistò rapidamente il ruolo di leader nel settore del sequenziamento genomico. I suoi sequenziatori sfruttavano ancora la DNA polimerasi come nella tecnologia precedente, ma introducevano due accorgimenti tecnici che facevano la differenza. Il primo è l’immobilizzazione del DNA su un supporto fisso: le molecole da sequenziare sono infatti incollate a un vetrino tramite degli adattatori. Questo permette di leggere milioni di frammenti di DNA contemporaneamente, perché ciascuno di essi viene a trovarsi in un punto preciso e non si può confondere con gli altri. La seconda, importantissima novità sono i terminatori reversibili. Nel metodo Sanger i nucleotidi modificati bloccavano la sintesi del DNA in modo irreversibile, mentre quelli di Illumina possono essere riattivati, grazie all’azione di un enzima che taglia via la parte di molecola che blocca il lavoro della DNA polimerasi. In questo modo, è possibile monitorare in tempo reale l’aggiunta di tutti i nucleotidi su ogni frammento, fotografando le fluorescenze emesse a ogni passaggio da tutte le molecole di DNA depositate sul vetrino.

I due grandi rivali di Solexa/Illumina erano, e sono tuttora, ABI/Solid e Roche/454. Le loro tecnologie sono molto diverse, e la prima grossa differenza è che entrambe queste aziende hanno scelto di immobilizzare le molecole di DNA non su un supporto solido, ma su delle piccole sfere, a loro volta poste su un vetrino. ABI/SOLiD ha persino abbandonato la DNA polimerasi per passare a un altro enzima, la DNA ligasi, che unisce frammenti di DNA anziché sintetizzarne di nuovi. Inoltre, ha elaborato un sistema di sequenziamento che consente di leggere due volte lo stesso nucleotide, il che abbassa di molto la possibilità di commettere errori.

Roche/454, dal canto suo, non utilizza più i nucleotidi fluorescenti, ma sfrutta un prodotto di scarto della polimerasi (il pirofosfato inorganico PPi) per generare dei flash di luce ogni volta che un nucleotide nuovo viene aggiunto. Il trucco è dare il PPi in pasto a una sulfurilasi, un enzima che lo utilizza per generare una molecola di ATP; a sua volta, l’ATP viene prelevato da una luciferasi che lo usa per ossidare una luciferina e produrre un segnale luminoso. Poiché questo segnale è sempre uguale per tutti i nucleotidi, essi devono essere immessi nel sistema un tipo alla volta: prima le A, poi le C e così via.

Gli incredibili progressi tecnologici e l’utilizzo di nuove chimiche di sequenziamento hanno permesso di fare grandi scoperte scientifiche sul nostro genoma, scoperte che presto ci saranno utili per avere cure personalizzate in base al nostro profilo genetico. Il bello, però, deve ancora arrivare. E arriverà con i sequenziatori di terza generazione, che pur essendo poco più che prototipi, promettono già grandissime cose.

IL SEQUENZIAMENTO DEL FUTURO

I prossimi anni vedranno sicuramente una nuova rivoluzione nel campo del sequenziamento, ma ancora non è chiaro se a portarla saranno macchine sempre più costose e potenti o piccoli strumenti low-cost grandi come una stampante, capaci di entrare con più facilità nella pratica medica di routine.

La prima strada è quella scelta da Pacific Biosciences, che sta mettendo a punto un sequenziatore mostruoso da 700mila dollari. Il suo punto di forza è essenzialmente uno solo: la capacità di sequenziare singole molecole di DNA. Nelle tecnologie precedenti, infatti, bisognava moltiplicare i frammenti per avere gruppi di molecole tutte uguali da sequenziare: solo così il segnale fluorescente era sufficientemente potente per poter essere visualizzabile dal lettore ottico. Riuscire a leggere una singola molecola di DNA, monitorando in tempo reale l’aggiunta dei nucleotidi, significa poter usare piccole quantità di DNA e risparmiare moltissimi soldi sui reagenti.

Altre due compagnie, invece, hanno deciso di abbandonare del tutto molecole fluorescenti e costosissimi lettori ottici. Ion Torrent ha messo in vendita un sequenziatore piccolissimo, che costa un decimo di quello di Pacific Biosciences: la sua peculiarità è che registra gli inserimenti dei nucleotidi misurando le variazioni di pH durante il sequenziamento.

Oxford Nanopore, al contrario, dice di essere in grado di leggere una sequenza di DNA basandosi sui cambiamenti nel flusso di corrente che attraversa dei fori di pochi nanometri, cambiamenti che sono caratteristici dello specifico nucleotide che viene aggiunto alla catena.

Il costo per sequenziare un genoma umano è diminuito di un milione di volte in dieci anni, e forse presto taglieremo il traguardo dei mille dollari. Arriverà il giorno in cui ci presenteremo dal nostro medico di fiducia con una chiavetta USB contenente i nostri dati genetici: grazie a queste informazioni conosceremo i farmaci più efficaci per noi e lo stile di vita che ci aiuterà a restare sani più a lungo. Non sappiamo quando entreremo veramente nell’era della medicina genomica, ma quando quel momento arriverà, il merito sarà anche degli incredibili progressi fatti negli ultimi anni dalla chimica del sequenziamento, un’altra delle infinite declinazioni della scienza di tutte le scienze, la Scienza Centrale.