https://frosthead.com

La Library of Congress smetterà di archiviare Twitter

Nel 2010, nessuno si aspettava che l'hub del discorso politico degli Stati Uniti si sarebbe presto spostato su Twitter, l'applicazione di messaggistica sociale che offriva agli utenti la possibilità di "microblog" di 140 caratteri (anche se recentemente è stato portato a un ventoso 280 personaggi). All'epoca, Twitter ha iniziato a inviare alla Biblioteca del Congresso tutti i tweet pubblici mai inviati, risalendo addirittura ai suoi primi giorni di esistenza nel 2006. Dopo 12 anni di afferrare ogni singola presa calda, faida fast-food, ripubblicare razzista, russo bot e strano riflesso del dril star di Twitter, la Biblioteca ne ha avuto abbastanza. Harper Neidig a The Hill riferisce che ieri il LOC ha annunciato che dopo il 31 dicembre raccoglierà solo i tweet che ritiene di importanza storica.

In un white paper sull'argomento, la Biblioteca cita diversi motivi per il cambiamento. Innanzitutto, il volume dei tweet è cresciuto notevolmente da quando è stato firmato un accordo con Twitter sette anni fa, rendendo la gestione della raccolta gravosa. Anche la natura dei tweet è cambiata. La biblioteca riceve solo i testi dei tweet e non riceve immagini, video o gif animate ad essi associati. Nel corso del tempo, poiché questa è diventata una parte più importante della cultura di Twitter, la raccolta ha perso molti contenuti e contesti.

La Biblioteca cita anche la recente espansione del limite dei caratteri del tweet come motivo del cambiamento, spiegando che Twitter si sta trasformando e potrebbe cambiare di più in futuro. “La Biblioteca generalmente non raccoglie in modo completo. Data la direzione sconosciuta dei social media quando il dono è stato pianificato per la prima volta, la Biblioteca ha fatto un'eccezione per i tweet pubblici ", spiega la Biblioteca nel documento. "Con i social media ormai consolidati, la Biblioteca sta rendendo le sue pratiche di raccolta più in linea con le sue politiche di raccolta."

Attualmente, l'archivio di 12 anni dei Tweet non è accessibile pubblicamente e il LOC non ha un calendario attuale per quando potrebbe essere disponibile. Ora dicono che servirà come un'istantanea dei primi 12 anni di una forma emergente di comunicazione sociale, come se la Biblioteca avesse ricevuto ogni telegrafo durante i primi 12 anni di quella tecnologia.

La mossa non era completamente fuori dal comune. Andrew McGill all'Atlantico spiega che il LOC non aveva le risorse o l'esperienza adeguate per il progetto e non aveva ingegneri che lavorassero a tempo pieno sui tweet. La Biblioteca ha più o meno lanciato gruppi di tweet non elaborati, 500 milioni prodotti ogni giorno, in un server da gestire in un secondo momento. "Questo è un avvertimento quando iniziamo a gestire i big data: dobbiamo stare attenti a ciò per cui ci iscriviamo", afferma Michael Zimmer dell'Università del Wisconsin-Milwaukee a McGill. "Quando le biblioteche non avevano le risorse per digitalizzare i libri, solo un'azienda delle dimensioni di Google era in grado di inserire denaro e corpi. E quello potrebbe essere il punto in cui la Biblioteca del Congresso è bloccata. "

Nel 2010, il numero di tweet era circa un decimo del traffico corrente e la funzione "retweet" era ancora nuova e i thread non erano attivi. Nel corso del tempo, tuttavia, i tweet incorporati in thread, foto e video e il nuovo limite di caratteri hanno reso ogni tweet più grande e il volume di dati giornalieri sconcertante. Entro il 2013, riferisce McGill, la Biblioteca ha già ammesso che stava lottando e ha affermato che condurre una ricerca nell'archivio tweet dal 2006 al 2010 richiederebbe 24 ore sull'attuale sistema LOC.

Nell'accordo originale, la Biblioteca ha accettato di embargo i tweet per sei mesi e di rimuovere eventuali tweet cancellati e tweet privati. I ricercatori erano entusiasti di accedere ai dati, ma sono rimasti delusi dalla mancanza di accesso del pubblico. Tuttavia, alcuni sperano che la Biblioteca alla fine troverà un modo per rendere accessibili i Tweet, che potrebbe essere molto prezioso per sociologi, psicologi, scienziati politici e altri ricercatori.

"Non sono un dottorato di ricerca, ma mi stupisce pensare a cosa potremmo essere in grado di imparare su noi stessi e il mondo che ci circonda da questa ricchezza di dati", ha scritto l'ex direttore delle comunicazioni di LOC Matt Raymond quando la partnership è stata annunciato. "E sono sicuro che impareremo cose che nessuno di noi ora può nemmeno concepire."

Anche se non abbiamo gli archivi da consultare, Twitter ci ha ancora insegnato molte cose. Le persone normali possono essere più esilaranti dei migliori comici. Possono anche essere stupidamente stupidi. I nazisti esistono ancora e non hanno alcun problema ad esprimere i loro pensieri orribili. I troll rovineranno qualsiasi conversazione, non importa quanto banale. E naturalmente la brevità è l'anima dell'ingegno. E arguzia in egual misura.

La Library of Congress smetterà di archiviare Twitter