L’unione fa la forza – Intervista a Boinc Italy, la regina del calcolo distribuito

Se c’è una cosa su cui tutti gli scienziati concordano al giorno d’oggi è il fatto che la bioinformatica sia ormai una strada obbligata per qualsiasi biologo o biotecnologo che voglia arrivare a un risultato scientifico. Che si tratti di un allineamento di sequenze o di strutture proteiche, tutti prima o poi si imbattono in questa disciplina sempre più necessaria. Lo studio dei fenomeni biologici mediante l’uso del computer (questa, in soldoni, è la definizione di “bioinformatica”) è tuttavia possibile soltanto quando si hanno a disposizione risorse computazionali adeguate, e queste sono tanto più imponenti quanto gli obiettivi sono ambiziosi. Fortunatamente esistono servizi come Boinc, una piattaforma internazionale di calcolo distribuito che mette a disposizione della ricerca scientifica la potenza di calcolo (in larga parte inutilizzata) di migliaia di personal computer sparsi nel mondo. Ho intervistato Stefano Bologna, referente italiano di uno dei tanti progetti attivi su Boinc Italy.

Che cos’è Boinc? Puoi illustrarci il suo funzionamento?

Per rispondere a questa domanda bisogna tornare un po’ indietro nel tempo: nel 1999 nasceva il progetto SETI@Home per la ricerca di segnali radio extraterrestri attraverso la distribuzione del lavoro via internet a volontari che mettevano a disposizione il proprio computer. L’idea alla base era quella che i pc di casa vengono utilizzati, mediamente, per il 10-15% della loro potenza, mentre il resto viene “sprecato”. Nel 2002 il direttore di Seti, David Anderson, e il suo team decisero di creare una piattaforma neutra che permettesse anche ad altri ricercatori di utilizzare il calcolo distribuito su desktop; così nel 2004 nasce ufficialmente la piattaforma BOINC, che a tutt’oggi è in grado di erogare quotidianamente un totale di circa 5,3 PetaFlops di potenza di calcolo, ovvero la metà del più potente supercomputer al mondo. Il funzionamento è molto semplice: è sufficiente scaricare dal sito di Boinc il programma (il nostro team lo ha tradotto in italiano) e installarlo. A questo punto bisogna scegliere il progetto a cui si vuole partecipare, iscriversi ad esso (basta una email ed una password) e poi collegarsi. Il progetto valuterà l’harware presente e comincerà a scaricare il lavoro da svolgere. Il nostro gruppo, ovviamente, è sempre a disposizione per aiutare chi si avvicina per la prima volta al mondo del calcolo distribuito.

Quanti progetti avete attivi al momento? E quali settori riguardano principalmente?

I progetti attivi, attualmente, sono circa una cinquantina e spaziano nei più diversi settori della ricerca scientifica, dalla bioinformatica (simulazioni proteiche/docking/folding, aiuto nella cristallografia a raggi-x, ecc) alla matematica (ricerca di numeri primi, congetture matematiche, ecc), dalle ricerche sul clima a quelle sull’astronomia/astrofisica, fino a progetti più “particolari”, come per esempio Virtual Prairie, che simula la crescita di erba in zone aride cercando soluzioni di irrigazione migliori oppure Clean Energy Project, che studia nuovi materiali per le celle solari. Una delle caratteristiche per cui il team Boinc Italy considera i progetti è il fatto che i progetti devono essere no-profit e che i risultati devono essere a disposizione di tutti. I progetti di ricerca provengono da moltissime nazioni (USA, Germania, Giappone, Spagna, ecc), ma al momento attuale non ci sono progetti italiani attivi e noi del gruppo Boinc Italy stiamo cercando di “stimolare” la ricerca italiana in tal senso.

Andando nel dettaglio dei progetti di biologia e medicina, quali sono i progetti che vanno per la maggiore?

I progetti di bioinformatica che vanno per la maggiore sono prevalentemente quelli “storici” del gruppo, come Rosetta@Home, Poem@Home e quelli biologici di WCG (Help Conquer Cancer, Help Fight Childhood Cancer, ecc), anche se nuovi progetti, come Correlizer e DNA@Home sono tenuti in considerazione. Alcuni dei nostri volontari, poi, sono referenti italiani per i progetti, occupandosi quindi della traduzione dei contenuti dall’inglese, dell’aggiornamento sulle novità dei progetti e della partecipazione ai forum dei progetti, dove possono entrare in contatto diretto con i ricercatori. Tutte le ricerche in campo bioinformatico, d’altro canto, non intendono sostituire la ricerca in laboratorio, che è quella “finale”, ma vogliono aiutarla in tutti i modi possibili.

Per quanto riguarda i progetti già conclusi, ce n’è qualcuno in particolare che ha dato risultati particolarmente importanti e del quale siete orgogliosi?

I progetti principali e più “famosi” non sono stati ancora chiusi e, probabilmente non lo saranno a breve, vista la mole di lavoro da compiere. Questo non significa che non siano stati raggiunti risultati importanti e lo dimostra il fatto che su tutti i siti dei progetti è presente una pagina in cui sono elencate le pubblicazioni scientificamente accettate (peer-review). Uno dei risultati che ci rende più orgogliosi è accaduto poco tempo fa e ci rende orgogliosi per le modalità con cui è stato raggiunto: il progetto Rosetta@home ha rilasciato, alcuni anni fa, un gioco (Fold.it) in cui i partecipanti (ricordiamolo, non sono ricercatori, ma gente comune) si cimentano nella simulazione di proteine e delle loro conformazioni. Un gruppo di scienziati alle prese da circa 10 anni con un particolare enzima coinvolto nell’AIDS non riuscivano a venirne a capo, e si sono rivolti alla comunità di Fold.it per avere un aiuto. In poco meno di 3 settimane i volontari sono riusciti a risolvere il “puzzle” proteico e a restituire risultati utilizzabili al gruppo di ricerca. Tutta la storia è narrata qui.

Quanti sono i partecipanti di Boinc che mettono a disposizione il proprio computer per la scienza? E come vengono ricompensati?

I partecipanti al gruppo Boinc Italy sono circa 9000, (di cui un terzo partecipa anche al sito e al forum di discussione), mentre a livello mondiale i partecipanti sono poco meno di 300000. Come già detto i progetti sono no-profit quindi non è prevista nessuna ricompensa monetaria, ma i progetti rilasciano dei punti per ogni unità di lavoro calcolata, e questi punteggi vengono poi usati, per esempio, per delle sfide simboliche tra gruppi di volontari. Il gruppo Boinc Italy considera le sue attività come un “volontariato” del terzo millennio.

Se un gruppo di ricerca volesse utilizzare le risorse di Boinc, cosa deve fare? Quali sono i requisiti per proporre un nuovo progetto?

Il team di Boinc ha pensato anche a questo: oltre all’ampia documentazione comprensiva di esempi presente sul sito, è anche possibile scaricare gratuitamente una macchina virtuale già configurata e pronta all’uso. I requisiti lato harware per cominciare un nuovo progetto sono, quindi, abbastanza accessibili: un server con connessione ad internet (se poi il progetto prendesse piede, è sempre possibile scalare verso l’alto l’infrastruttura informatica). Dal lato software, inoltre, la piattaforma Boinc supporta una vasta gamma di linguaggi di programmazione, dal Fortran al C++ fino al più recente OpenCL, linguaggio in rapida ascesa vista la possibilità di usare le schede video per il calcolo.

Quindi che state aspettando? Se volete pubblicare un articolo su PNAS come hanno fatto i giocatori di Foldit non dovete fare altro che collegarvi a Boinc, scaricare il software e iniziare a dare un aiuto concreto alla ricerca scientifica.

Annunci

Un pensiero su “L’unione fa la forza – Intervista a Boinc Italy, la regina del calcolo distribuito

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...