Cloud computing, Amazon al servizio della genomica

Tempo fa scrissi un post in cui commentavo l’articolo pubblicato da Lincoln Stein, nel quale si sottolineava l’importanza del cloud computing per la gestione dei dati di genomica. Sequenziare un genoma sta diventando sempre meno costoso, e, attratti da questo continuo calo dei prezzi, sempre più laboratori in tutto il mondo entrano con decisione nel mondo del next-generation sequencing. Benché questo sia sicuramente positivo per la ricerca, gli effetti collaterali non mancano: le sequenze prodotte cominciano a diventare talmente tante da richiedere risorse computazionali elevatissime per la loro gestione e il loro utilizzo, risorse che non sempre un piccolo istituto può permettersi. La soluzione che Stein proponeva nel suo articolo era il cloud computing, espressione che sta semplicemente ad indicare l’affitto di potenti computer appartenenti a colossi dell’informatica.

La famosa società di commercio elettronico Amazon offre da un paio d’anni un servizio chiamato Amazon Web Services, il quale permette di acquistare spazio su disco e tempo di calcolo dalla sterminata rete di computer dell’azienda, ma solo nell’ultimo anno il mondo della ricerca ha cominciato a interessarsi a questa opportunità per la gestione dei dati genomici. Ad oggi, comunque, i clienti non mancano. Broad Institute e Medical School di Harvard sono alcuni degli utilizzatori, ma usufruiscono del servizio anche produttori di strumenti per il sequenziamento come la Life Technologies o piccole startup di bioinformatica quali Geospiza e DNAnexus.

Se questo diventerà un business importante per Amazon al momento non si sa, visto che comunque gli ostacoli non mancano. Molti istituti hanno già fatto grossi investimenti per acquistare dei propri server per la gestione e l’analisi dei dati, e difficilmente abbandoneranno le nuove infrastrutture per le quali hanno speso tanti soldi. C’è poi il fatto che tendenzialmente i ricercatori si sentono più sicuri ad avere i propri dati sotto controllo, chiusi a chiave nella stanza accanto, piuttosto che a depositarli in qualche remoto server di Amazon. Infine, c’è una questione puramente tecnica che è quella della larghezza di banda, spesso non sufficiente per trasferire le quantità enormi di sequenze che vengono generate (Amazon ha risolto quest’ultimo problema con spedizioni vecchio stile tramite corriere).

In ogni caso, la strada del cloud computing è l’unica percorribile, e prima o poi i gruppi di ricerca dovranno adeguarsi. Le infrastrutture informatiche sono ormai diventate il vero collo di bottiglia in un progetto di sequenziamento, perciò non c’è alternativa se non quella di rivolgersi a colossi della tecnologia come Amazon. Dopotutto, utilizzando computer in remoto che sono condivisi da migliaia di utenti si avrebbe una perfetta ottimizzazione delle risorse disponibili, cosa che certamente non si può ottenere con i server dei singoli laboratori, i quali rimangono spenti o inutilizzati per diverse ore nell’arco di una giornata. La speranza è che il cloud computing possa davvero togliere un grosso peso ai ricercatori, in modo che si possano concentrare su una cosa fondamentale, che ancora manca: i programmi per analizzare in modo efficace tutti quei dati.

Fonte: Xconomy.com

Lascia un commento