https://frosthead.com

Big data o troppe informazioni?

Sappiamo tutti che ci sono molte più informazioni nei nostri mondi rispetto a prima. Quanto a più, beh, la maggior parte di noi è piuttosto all'oscuro.

Contenuto relativo

  • Infografica attraverso i secoli Evidenzia la bellezza visiva della scienza
  • Perché le tendenze influenzali di Google non riescono a tenere traccia dell'influenza (ancora)

Ecco una pepita inestimabile su tutte queste informazioni, complimenti di Dave Turek, il responsabile dello sviluppo di supercomputer presso IBM: dall'anno 2003 e lavorando all'indietro fino all'inizio della storia umana, abbiamo generato, secondo i calcoli di IBM, cinque exabyte: questo è cinque miliardi di gigabyte di informazioni. L'anno scorso, stavamo estraendo molti dati ogni due giorni. Entro l'anno prossimo, prevede Turek, lo faremo ogni 10 minuti.

Ma come è possibile? In che modo i dati sono diventati tali kudzu digitali? In parole povere, ogni volta che il tuo cellulare invia la sua posizione GPS, ogni volta che acquisti qualcosa online, ogni volta che fai clic sul pulsante Mi piace su Facebook, stai mettendo un altro messaggio digitale in una bottiglia. E ora gli oceani sono praticamente coperti da loro.

E questa è solo una parte della storia. Messaggi di testo, registri dei clienti, transazioni bancomat, immagini di telecamere di sicurezza ... l'elenco potrebbe continuare all'infinito. La parola d'ordine per descrivere questo è "Big Data", anche se difficilmente rende giustizia alle dimensioni del mostro che abbiamo creato.

È l'ultimo esempio di tecnologia che supera la nostra capacità di utilizzarlo. In questo caso, non abbiamo iniziato a metterci al passo con la nostra capacità di acquisire informazioni, motivo per cui al giorno d'oggi un gruppo preferito di esperti di gestione è che il futuro appartiene a società e governi che possono dare un senso a tutti i dati che stanno raccolta, preferibilmente in tempo reale.

Le aziende in grado di interpretare ogni briciola di pane digitale che i loro clienti si lasciano alle spalle avranno un vantaggio, il pensiero va - non solo chi ha comprato cosa dove nell'ultima ora - ma se hanno twittato o pubblicato una foto da qualche parte nel turbinio dei social network. Lo stesso vale per le città che possono raccogliere dati da migliaia di sensori che ora punteggiano paesaggi urbani e trasformano i capricci della vita cittadina, come il flusso del traffico, in una scienza.

Non sorprende che le campagne politiche stiano già facendo il grande passo, estraendo furiosamente i dati come parte della loro attenzione sul "nanotargeting" degli elettori in modo che sappiano esattamente come spingerli per i loro voti e denaro. Tra le conclusioni che gli analisti hanno tratto, secondo il editorialista del New York Times Thomas Edsall, è che i repubblicani mostrano una preferenza per i ristoranti "The Office" e Cracker Barrel mentre i democratici hanno maggiori probabilità di guardare "Late Night With David Letterman" e mangiare a Chuck E . Formaggio.

Questa fretta di interpretare il flotsam digitale spiega perché Google la scorsa settimana ha annunciato che inizierà a vendere un prodotto che chiama BigQuery, un software in grado di scansionare terabyte di informazioni in pochi secondi. E perché una startup di nome Splunk, che ha una tecnologia in grado di analizzare enormi quantità di dati di clienti e transazioni, ha visto il valore delle sue azioni salire quasi del 90% il giorno in cui è stato reso pubblico il mese scorso. Questo, per un'azienda che ha perso $ 11 milioni l'anno scorso.

Aumento del data scientist

Ma anche l'accesso ai migliori strumenti di decodifica dei dati non è garanzia di grande saggezza. Pochissime aziende hanno personale addetto alla formazione non solo per valutare montagne di dati, tra cui un sacco di informazioni non strutturate da milioni di pagine di Facebook e smartphone, ma anche per fare effettivamente qualcosa con esso.

L'anno scorso la McKinsey Global Insitute ha pubblicato un rapporto che descrive i "Big Data" come la "prossima frontiera per l'innovazione", ma prevede anche che entro il 2018, le aziende negli Stati Uniti avranno una grave carenza di talenti quando si tratta delle necessarie capacità analitiche - come 190.000 persone. E sostiene che altri 1, 5 milioni di manager dovranno essere formati per prendere decisioni strategiche con il flusso di dati che si fa strada.

Non tutti credono nella magia dei Big Data. Peter Fader, professore di marketing presso la Wharton School of Business di Penn, non è convinto che più dati siano migliori. Non che pensi che un'azienda non dovrebbe cercare di imparare il più possibile sui suoi clienti. È solo che ora c'è così tanta attenzione sull'aggregazione di ogni bit di dati che pensa che il volume sia valutato sulla vera analisi.

Ecco la presa di Fader da una recente intervista con Technology Review del MIT : “Anche con una conoscenza infinita del comportamento passato, spesso non avremo abbastanza informazioni per fare previsioni significative sul futuro. In effetti, più dati abbiamo, più falsa fiducia avremo ... La parte importante è capire quali sono i nostri limiti e usare la migliore scienza possibile per colmare le lacune. Tutti i dati nel mondo non raggiungeranno mai questo obiettivo per noi. "

Chi sono i tuoi dati?

Ecco un esempio di come vengono utilizzati i Big Data per risolvere grossi problemi:

  • Sanno quando sono stati cattivi o buoni: mentre la maggior parte delle aziende si sta concentrando sull'analisi dei propri clienti, Amazon sta segnando punti usando i Big Data per aiutarli.
  • Lo studio delle borchie: vuoi sapere quali tori generano le mucche da latte più produttive? L'industria lattiero-casearia ha escogitato un modo per sgretolare i numeri.
  • Diagnosi in base ai dati: i ricercatori di SUNY Buffalo stanno analizzando enormi quantità di dati nel tentativo di determinare se esiste un legame tra sclerosi multipla e fattori ambientali, come la scarsa esposizione alla luce solare.
  • In cerca di problemi: una società chiamata Recorded Future sta estraendo informazioni dai social network e dai siti governativi e finanziari per fare previsioni su come la crescita della popolazione, la carenza idrica e condizioni meteorologiche estreme potrebbero portare a futuri disordini politici e terrorismo.

Bonus video: acquisire dati è una cosa. Renderlo attraente e comprensibile è un'altra sfida. David McCandless parla del potere delle "mappe informative" in questo discorso TED.

Big data o troppe informazioni?