I geni dell’amicizia esistono davvero? La risposta è nella statistica

ResearchBlogging.org

La notizia è di settimana scorsa, ma non ne avevo ancora parlato sul blog perché quando si tratta di scoperte così bizzarre preferisco documentarmi un attimo e leggere l’articolo originale, pubblicato in questo caso sulla prestigiosa rivista PNAS. Secondo uno studio condotto da ricercatori americani, infatti, sembra esistere una correlazione tra i nostri geni e gli amici che ci scegliamo!

Gli autori hanno analizzato sei geni legati al comportamento (DRD2, DRD4, CYP2A6, MAOA, SLC6A3 e SLC6A4) in una rete sociale composta da circa un migliaio di individui, scoprendo che due di essi (DRD2 e CYP2A6) mostravano una correlazione piuttosto evidente con la scelta delle amicizie. In particolare, due persone amiche tra loro avevano un’alta probabilità di condividere la stessa variante genetica del gene DRD2, mentre per il CYP2A6 la correlazione era inversa: gli individui cercavano amici con una variante del gene diversa dalla propria. Le correlazioni sono state confermate anche in una seconda rete di amicizie composta da 2000-3000 soggetti.

Leggendo l’articolo si scopre che le associazioni trovate sembrano piuttosto forti e statisticamente significative. Per quanto riguarda DRD2 il p-value è di 0.0001: vuol dire che c’è appena una probabilità su 10mila che la correlazione trovata sia dovuta al caso. Esiste quindi davvero una stretta associazione tra questi due geni e il modo in cui selezioniamo i nostri amici, anche se dare un’interpretazione convincente a questo risultato non è affatto semplice. Gli autori ritengono che il caso del gene DRD2 possa essere spiegato in funzione dell’associazione di questo gene con l’alcolismo: chi ha una variante che lo predispone all’alcolismo cercherà amici con la stessa variante, con cui ubriacarsi in compagnia. Un po’ meno intuitivo è il discorso relativo al gene CYP2A6: chi possiede una certa variante di questo gene è caratterialmente più aperto, quindi non si riesce a capire perché una persona “geneticamente” più socievole debba volontariamente escludere persone altrettanto espansive dalla propria cerchia di amici.

Come sempre accade quando si parla di genetica comportamentale, non sono mancate critiche e commenti scettici. Il genetista David Altshuler, del Broad Institute di Cambridge, ricorda che gli studi di associazione genome-wide che vengono normalmente condotti per trovare le basi genetiche delle malattie devono analizzare centinaia di migliaia di varianti per riuscire a individuarne qualcuna significativa. Trovare due geni buoni analizzandone solo sei – dice Altshuler – è come comprare sei biglietti della lotteria e vincere il primo e il secondo premio: gli autori sono stati troppo fortunati, così fortunati da far pensare che ci sia sotto qualcosa. Eppure le due associazioni trovate sono statisticamente robuste: i p-value sono significativi. Quindi? Dove sta l’inghippo?

Mentre leggevo l’articolo con lo stesso sano scetticismo di Altshuler, mi è caduto l’occhio su tre paroline magiche: “correzione di Bonferroni“. Questa procedura si utilizza per eliminare i falsi positivi quando si compiono una serie di test statistici, e dipende direttamente dal numero di test eseguiti. Non voglio entrare nei dettagli (chi conosce un po’ di statistica avrà capito di cosa sto parlando), ma in pratica più test eseguo (cioè più geni vado a testare) più devo essere stringente nella mia soglia di significatività. Se fisso una soglia iniziale di significatività a 0.05, la soglia corretta con il metodo di Bonferroni sarà 0.05 diviso 6 (0.008): tutti i geni che hanno un p-value inferiore a 0.008 saranno considerati buoni. Se però invece di fare 6 test ne faccio 100mila, l’asticella si abbasserà di tantissimo: il p-value massimo accettato sarà 5 per dieci alla meno 7, molto più basso dei valori trovati in questo studio!

Questa digressione statistica soltanto per dimostrarvi che se avessero eseguito un GWAS come Dio comanda, con centinaia di migliaia di SNP da testare, molto probabilmente DRD2 e CYP2A6 non li avrebbero mai trovati. James Fowler, uno degli autori, ha dichiarato sul blog Genetic Future che presto avranno i risultati di un vero studio di associazione genome-wide basato su 17mila individui: sarà un ottimo banco di prova per le due associazioni trovate. Per il momento io rimango col beneficio del dubbio.


Fowler, J., Settle, J., & Christakis, N. (2011). Correlated genotypes in friendship networks Proceedings of the National Academy of Sciences DOI: 10.1073/pnas.1011687108

Annunci

BCI 2010 – Simulazioni 3D, filosofia e… baffi di topo

Questa settimana ho partecipato alla scuola estiva BCI (Biology Computation and Information), organizzata dall’Università di Trieste nella cittadina di Dobbiaco, sulle alpi altoatesine. A tenere le lezioni c’erano tre esperti nel settore della bioinformatica, venuti dagli Stati Uniti e dall’Inghilterra per raccontare la loro esperienza come studiosi di fenomeni biologici mediante l’utilizzo di tecniche computazionali.

Jasmin Fisher, del Microsoft Research Centre di Cambridge, ha parlato delle sue simulazioni di processi biologici, come lo sviluppo della vulva del verme Caenorhabditis elegans: utilizzando delle reti chiamate state charts, il gruppo della Fisher è riuscito a riprodurre su un computer il differenziamento di specifiche cellule di questo organismo, che in natura avviene grazie a particolari segnali chimici. Il team inglese si è dedicato anche alla modellizzazione di altri fenomeni di vario genere, più o meno utili, ma di sicuro effetto scenografico, specie quando si è passati alle simulazioni 3D. I tool per la visualizzazione dei complicati processi modellizzati sono sviluppati dallo stesso gruppo, che si è posto come obiettivo di progettare software il più possibile user-friendly, adatti cioè ai biologi che poi li dovranno utilizzare.

Un po’ più impegnative sono state le lezioni di Bud Mishra della New York University. Filosofia, logica e statistica sono le carte messe sul tavolo dal professore di informatica indiano, nel tentativo di tratteggiare con precisione la differenza tra il concetto di correlazione e quello di causalità. Emblematico l’esempio del barometro: quando la pressione scende il barometro lo segnala, e poco dopo si scatena un temporale. Potremmo ingenuamente ritenere che sia stato il barometro a provocare la tempesta, quando in realtà i due eventi si verificano insieme semplicemente perché hanno una causa comune. Che scoperta, direte voi. Eppure queste sono le stesse conclusioni a cui si potrebbe erroneamente giungere quando, ad esempio, si cercano i geni responsabili di una certa malattia. Ecco perché è importante affrontare questi problemi con attenzione e soprattutto con gli strumenti logico-matematici corretti.

Il pezzo grosso tra gli speaker, però, era certamente Eugene Myers, l’uomo che ha inventato l’algoritmo di BLAST: per chi non lo sapesse, BLAST è il programma che tutti i biologi del mondo utilizzano ogni giorno per fare ricerche di similarità di sequenza nelle banche dati pubbliche. Dopo aver contribuito al sequenziamento del genoma umano lavorando alla Celera Genomics di Craig Venter, però, Myers ha deciso di cambiare completamente settore, passando dalla genomica all’analisi di immagini. Secondo il brillante informatico americano, infatti, il modo migliore per capire la biologia è osservarla, vederla in azione. Lo strumento utilizzato è il classico microscopio, ma questa volta, grazie agli algoritmi, le immagini acquistano un aspetto quantitativo che prima l’occhio umano non poteva registrare. Ecco allora che nasce un programma per localizzare le vibrisse di un topo mentre si muovono, o il codice che permette al computer di memorizzare il disegno articolato delle ali di un moscerino della frutta. Lungi dall’essere semplici esercizi di stile, questi algoritmi consentono di tradurre i pixel in numeri e danno la possibilità di scoprire dettagli impercettibili e relazioni che altrimenti sarebbero passate inosservate.