https://frosthead.com

La vasta maggioranza dei dati grezzi provenienti da vecchi studi scientifici ora può mancare

Una delle basi del metodo scientifico è la riproducibilità dei risultati. In un laboratorio in qualsiasi parte del mondo, un ricercatore dovrebbe essere in grado di studiare la stessa materia di un altro scienziato e riprodurre gli stessi dati, oppure analizzare gli stessi dati e notare gli stessi schemi.

Ecco perché i risultati di uno studio pubblicato oggi su Current Biology sono così preoccupanti. Quando un gruppo di ricercatori ha provato a inviare per e-mail gli autori di 516 studi biologici pubblicati tra il 1991 e il 2011 e ha chiesto i dati grezzi, sono rimasti sgomenti nello scoprire che oltre il 90 percento dei dati più vecchi (da articoli scritti più di 20 anni fa) erano inaccessibile. In totale, anche includendo articoli pubblicati nel 2011, sono stati in grado di rintracciare i dati solo per il 23 percento.

"Tutti sanno che se chiedi a un ricercatore i dati di vecchi studi, faranno orlo, perché non sanno dove si trova", afferma Timothy Vines, uno zoologo dell'Università della British Columbia, che ha guidato lo sforzo. "Ma non ci sono mai state stime sistematiche di quanto velocemente scompaiano i dati detenuti dagli autori."

Per fare una stima, il suo gruppo ha scelto un tipo di dati che è stato relativamente coerente nel tempo - misurazioni anatomiche di piante e animali - e ha raccolto tra 25 e 40 articoli per ogni anno dispari durante il periodo che ha usato questo tipo di dati, per vedere se potessero dare la caccia ai numeri grezzi.

Una quantità sorprendente delle loro richieste è stata interrotta al primo passo: per il 25 percento degli studi, gli indirizzi e-mail attivi non sono stati trovati, con indirizzi defunti elencati sul documento stesso e ricerche sul web che non hanno trovato quelli attuali. Per un altro 38% degli studi, le loro domande non hanno portato a nessuna risposta. Un altro 7 percento dei set di dati è stato perso o inaccessibile.

"Qualche volta, ad esempio, è stato salvato su floppy disk da tre pollici e mezzo di pollice, quindi nessuno poteva accedervi, perché non avevano più le unità appropriate", afferma Vines. Poiché l'idea di base di conservare i dati è tale che possano essere utilizzati da altri nella ricerca futura, questo tipo di obsolescenza rende essenzialmente i dati inutili.

Questi potrebbero sembrare banali ostacoli, ma gli scienziati sono come tutti noi: cambiano gli indirizzi e-mail, ottengono nuovi computer con unità diverse, perdono i loro backup di file, quindi queste tendenze riflettono gravi problemi sistemici nella scienza.

E la conservazione dei dati è così importante, vale la pena ricordare, perché è impossibile prevedere in quali direzioni la ricerca si sposterà in futuro. Vines, ad esempio, ha condotto le proprie ricerche su una coppia di specie di rospi originarie dell'Europa orientale che sembrano essere in procinto di ibridarsi. Negli anni '80, afferma, un team separato di ricercatori stava lavorando sullo stesso argomento e si imbatté in un vecchio documento che documentava la distribuzione di questi rospi negli anni '30. Sapere che la loro distribuzione era cambiata relativamente poco nel corso dei decenni successivi ha permesso agli scienziati di fare tutti i tipi di calcoli che altrimenti non sarebbero stati possibili. "I dati originali disponibili, tratti da un piccolissimo vecchio studio scritto in polacco, sono stati incredibilmente utili per i ricercatori che sono arrivati ​​70 anni dopo", afferma.

C'è anche il fatto che gran parte di questa ricerca è finanziata con fondi pubblici, molti dei quali provengono da sovvenzioni che stabiliscono che i dati risultanti siano resi disponibili gratuitamente al pubblico. Inoltre, i dati sul campo sono influenzati dalle circostanze dell'ambiente in cui sono raccolti, quindi è impossibile replicare perfettamente in seguito, quando le condizioni sono cambiate.

Qual è la soluzione? Alcune riviste, tra cui Molecular Ecology, di cui Vines è caporedattore, hanno adottato politiche che richiedono agli autori di inviare dati grezzi insieme ai loro articoli, consentendo alla rivista stessa di archiviare i dati per sempre. Sebbene le riviste, come le persone, siano suscettibili al cambiamento degli indirizzi e-mail e all'obsolescenza tecnologica, questi problemi possono essere gestiti molto più facilmente su scala istituzionale.

La vasta maggioranza dei dati grezzi provenienti da vecchi studi scientifici ora può mancare