L’ereditabilità c’è, ma non si vede

“Ha preso tutto da sua madre!” “Gli occhi sono del papà, il naso della mamma!” Quante volte abbiamo sentito frasi del genere davanti alla culla di un bimbo appena nato? Il concetto di ereditabilità è ben radicato nella nostra cultura, dunque non sarà difficile capire cosa intendo quando dico, ad esempio, che l’ereditabilità dell’altezza umana si attesta attorno all’80%. Significa che quanto uno è alto dipende in larga parte dall’altezza dei suoi genitori. Per arrivare a numeri come questo, gli scienziati studiano i gemelli, confrontando monozigoti (geneticamente identici) ed eterozigoti. Si suppone che la variabilità osservata in un certo tratto fenotipico (altezza, peso, malattie..) dipenda in parte dalla genetica e in parte dall’ambiente, e gli studi sui gemelli servono appunto a scindere queste due componenti, attribuendo un peso diverso all’una e all’altra.

Queste percentuali sono importanti, perché servono come riferimento per gli studi di associazione su scala genomica, i GWAS (Genome-Wide Association Studies). Se un gruppo di ricerca scopre che una variante genetica è legata a un certo tratto, la domanda successiva sarà: quanta ereditabilità posso spiegare con la mia variante? Il sogno di un genetista, ovviamente, sarebbe scoprire che l’ereditabilità prevista studiando i gemelli dipenda tutta dal gene che ha appena scoperto. Ahimé, a causa della immensa complessità dei sistemi biologici, quasi sempre questo sogno resta tale. Tanto per fare un esempio, tutte le varianti associate all’altezza emerse dai GWAS negli ultimi anni sono state in grado di spiegare complessivamene appena il 10% della variabilità osservata in questo tratto: siamo evidentemente ben lontani dall’80%! Ed è così per moltissimi tratti ereditabili.

Il grosso problema è che quando si analizzano centinaia di migliaia di posizioni genomiche, è facile incappare in falsi positivi, soprattutto quando il numero di individui testati non è sufficientemente elevato. Per ovviare a ciò, nei GWAS si utilizzano dei filtri molto stringenti, che dovrebbero far emergere solo quelle varianti davvero sicure, scartando invece quelle dubbie. Così facendo, però, vengono eliminati anche dei veri positivi, che benché singolarmente spieghino una piccola frazione dell’ereditabilità, presi tutti insieme potrebbero contribuirvi in modo consistente. Per testare quanta ereditabilità viene persa in questo modo, un gruppo di ricerca internazionale ha considerato complessivamente i polimorfismi SNP comuni nella popolazione, inserendoli tutti quanti in un grande modello matematico. Gli autori hanno analizzato i genomi di 11586 individui, esaminando quasi 300mila SNP. Successivamente, hanno calcolato quanta ereditabilità riusciva a spiegare il loro modello in quattro diversi tratti: altezza, indice di massa corporea (BMI), fattore di von Willebrand (coinvolto nella coagulazione del sangue) e intervallo QT (legato alle aritmie cardiache).

Prima di darvi le nuove percentuali è il caso che vi dica quelle che si erano potute ottenere in precedenza, considerando solo gli SNP emersi come significativi dagli studi GWAS, le varianti “forti”. Per l’altezza si arrivava al 10%, per l’indice di massa corporea all’1,5%, per il fattore di von Willebrand al 13% e per l’intervallo QT al 7%. Con questo modello, che come ho detto tiene in considerazione tutti gli SNP, si ottengono rispettivamente: 45%, 17%, 25% e 21%. Per l’altezza siamo ancora distanti dall’obiettivo dell’80%, ma capite bene che tra 10 e 45% c’è una notevole differenza.

Il messaggio che possiamo trarre da questo lavoro, pubblicato su Nature Genetics, è che l’ereditabilità mancante è sotto i nostri occhi, soltanto che è frammentata in centinaia di piccole componenti, troppo piccole per poter essere rilevate con i GWAS tradizionali. Ci dice inoltre un’altra cosa, molto importante: che non è necessario scomodare varianti rare dagli effetti molto potenti per poter spiegare la variabilità che osserviamo nei tratti fenotipici, come qualcuno sostiene. Se i nostri metodi di indagine avessero una risoluzione più elevata, potremmo estrarre molta più informazione dagli SNP comuni, quelli che vengono normalmente utilizzati: e la risoluzione potremmo incrementarla ad esempio realizzando dei GWAS con un maggior numero di partecipanti. Naturalmente, ciò non basterà: è chiaro che tra i “colpevoli” ci deve essere anche qualche variante rara, altrimenti un modello onnicomprensivo come questo avrebbe fatto bingo. Prima di partire a razzo con i sequenziamenti genomici, però, assicuriamoci di avere utilizzato al meglio tutti i dati che abbiamo già.

Altri link:

Alla ricerca dell’ereditabilità mancante: dove sono i geni dell’altezza? (myGenomiX)

La ricerca genomica a un punto si volta (myGenomiX)

Yang, J., Manolio, T., Pasquale, L., Boerwinkle, E., Caporaso, N., Cunningham, J., de Andrade, M., Feenstra, B., Feingold, E., Hayes, M., Hill, W., Landi, M., Alonso, A., Lettre, G., Lin, P., Ling, H., Lowe, W., Mathias, R., Melbye, M., Pugh, E., Cornelis, M., Weir, B., Goddard, M., & Visscher, P. (2011). Genome partitioning of genetic variation for complex traits using common SNPs Nature Genetics DOI: 10.1038/ng.823

3 pensieri riguardo “L’ereditabilità c’è, ma non si vede”

Alberto ha detto:

27 Maggio 2011 alle 12:24

Non ho capito come questo calcolo delle probabilità valuta gli effetti sinergici.
Ad esempio una variante potrebbe influire per il 5% e un altra idem (o addirittura essere negativa), ma se ci sono tutte e due provocare condizioni emergenti nuove per cui l’influenza diventa il 20%. Nei sistemi complessi è dura questa valutazione, come viene fatta qui?

Rispondi
emmecola ha detto:

27 Maggio 2011 alle 14:03

Hai ragione, le interazioni tra gli SNP possono essere molto importanti. Hanno utilizzato un modello lineare misto, ti incollo la loro metodologia tradotta:

Abbiamo stimato la varianza spiegata da tutti gli SNP autosomali mediante il metodo della massima verosimiglianza analizzando un modello linear misto MLM y = Xβ + gG + ε, dove y è un vettore di fenotipi, b è un vettore di effetti fissi (per esempio le prime dieci componenti principali) con la sua matrice di incidenza X, gG è un vettore di effetti aggregati di tutti gli SNP autosomali con var(gG) = AGσG^2, e AG è la matrice di parentela genetica stimata da tutti gli SNP autosomali. La proporzione di varianza spiegata da tutti gli SNP autosomali è definita come hG^2=σG^2/σP^2, dove σP^2 è la varianza fenotipica.

Credo servano delle buone conoscenze di statistica per capire cosa hanno fatto esattamente! 🙂

Rispondi
1. Alberto ha detto:
  
  27 Maggio 2011 alle 19:20
  
  Posso informarmi nel dettaglio, ho un’amica in gamba che insegna statistica …
  
  Per quanto ne so la massima verosimiglianza non assegna “potere” alle interazioni, ma solo alle componenti in modo lineare, valutando su un ampio campione la varianza di questi pesi assegnati a ogni componente, confidando che le interazioni compaiano e contribuiscano al calcolo in un campione sufficientemente grande, ma temo che l’influenza delle interazioni finisca nella varianza e non ne viene rilevata l’emergenza (nel senso di “emergere”, non di allarme).
  
  NOTA: potrei aver detto fesserie 😀
  
  Rispondi