https://frosthead.com

Questo potrebbe essere l'albero genealogico più grande del mondo

L'aumento dei test del DNA attraverso servizi come 23andme mostra che esiste un grande mercato per la storia familiare.

Ora, gli scienziati hanno costruito su questi dati pubblicando quello che credono sia il più grande database di genealogia del mondo, con un albero genealogico che collega 13 milioni di persone e risale a più di cinque secoli fa.

Come riferisce Jocelyn Kaiser per la rivista Science, Yaniv Erlich, genetista computazionale della Columbia University, ha elaborato il progetto sette anni fa dopo aver ricevuto un'e-mail da un lontano cugino parente attraverso Geni.com, uno dei tanti siti in cui cercare legami familiari.

Con il supporto del Chief Technology Officer di Gemi.com, Erlich ha scaricato i profili pubblici del sito - decine di milioni di essi. Sebbene non offrisse dati sul DNA, le informazioni includevano il nome, il sesso, la data e il luogo di nascita di una persona, la data di morte e i parenti stretti.

La natura ha scritto del progetto di Erlich nelle sue prime fasi nel 2013 e l'anno scorso, Sarah Zhang dell'Atlantico ha riferito che i ricercatori avevano rilasciato una prestampa dell'albero massiccio. Ora, scrive Kaiser, il team di Erlich ha pubblicato uno studio sul loro lavoro sulla rivista Science. Usando i dati, hanno raggiunto 5, 3 milioni di alberi, il più grande dei quali collega circa 13 milioni di parenti, per lo più di origine europea.

Dall'inizio del progetto, Erlich è diventato il capo scientifico di MyHeritage, una società di genealogia e test del DNA proprietaria di Geni.com. Venerdì scorso ha fatto un Reddit Ask Me Anything sulle sue scoperte, correggendo idee sbagliate e spiegando la metodologia alla base del progetto. Ha anche notato che la parte più interessante dell'esperienza per lui è stata capire come tradurre tutti i dati disponibili in qualcosa di personale.

In un'intervista a Nicole Wetsman del National Geographic, Erlich afferma che capire come lavorare con quei dati è stata anche la parte più stimolante del progetto. “I set di dati genomici hanno strumenti, strutture di dati, metodi specifici, ma per questo non ne avevamo. Stavamo inventando la ruota mentre andavamo ", dice.

Alla fine, i ricercatori hanno usato la teoria dei grafi matematica per organizzare e verificare le informazioni, riferisce Laura Geggel per Live Science . Hanno anche confrontato i profili con circa 80.000 certificati di morte disponibili pubblicamente dal Vermont in un periodo di 25 anni per assicurarsi che non fossero solo profili ricchi caricati su Geni.com.

Il team ha quindi deciso quali informazioni volessero cercare per testare il database, scrive Wetsman.

Hanno iniziato a guardare i modelli e hanno trovato fluttuazioni nella durata della vita, qualcosa che avevano previsto. Ad esempio, hanno visto una goccia di giovani uomini durante la guerra civile e le guerre mondiali I e II, e un aumento della sopravvivenza infantile nel 1900. Furono anche in grado di tracciare la migrazione, come l'arrivo del Mayflower nel 1620 in quello che oggi è il Massachusetts, seguito da un aumento delle nascite in quella zona.

I ricercatori hanno anche scoperto che la longevità ha più a che fare con l'ambiente e il comportamento che con la genetica; in effetti, i dati rivelati sono i geni responsabili solo del 16% della durata della vita. Paola Sebastiani, professore di biostatistica presso la School of Public Health della Boston University, avverte tuttavia di trarre conclusioni su questi dati in un'intervista a Wetsman. "C'è molta confusione sulle definizioni di longevità", afferma.

Il genetista Peter Visscher dell'Università del Queensland a Brisbane, in Australia, dice a Kaiser che i dati osservati dal team di Erlich hanno il potenziale per fornire informazioni sul ruolo della genetica sulle malattie se i dati sono collegati alle informazioni sulla salute.

Il team di ricerca ha già iniziato a combinare l'albero con le informazioni del DNA, che raccoglie i dati del DNA, il che potrebbe significare che un albero ancora più grande potrebbe arrivare presto. I ricercatori prevedono che se il database potrebbe risalire a 65 generazioni, saranno in grado di completare l'albero.

Questo potrebbe essere l'albero genealogico più grande del mondo