La traduzione letterale del termine big data è “una grande massa di dati”, tuttavia il termine racchiude in sé un concetto più ampio e identifica l’innovativa modalità di gestire le grandi quantità di dati. In particolare, il termine fa riferimento alla tecnologia che consente di estrarre valore dall’immensa quantità di dati che ogni persona produce ogni giorno.
I big data, dal momento della loro nascita, hanno assunto un’ importanza sempre crescente e hanno avuto un impatto notevole sulle vite degli utenti. Per dare un’idea della grandezza del fenomeno, basti pensare che il World Economic Forum nel 2011 ha definito i dati come un nuovo fattore di produzione, al pari del lavoro e del capitale.
Hadoop
La rivoluzione dei big data ha alla base un’importante innovazione: la capacità di processare ogni dato e di renderlo persistente. Ciò è stato reso possibile grazie allo sviluppo di un sistema di gestione dei dati, chiamato Hadoop, che supera ogni problema legato alla loro classificazione e presuppone nuove capacità di collegare fra loro le informazioni.
I sistemi di storage tradizionali, infatti, hanno due limiti: permettono di registrare solo una certa quantità di dati, superata la quale è necessario aumentare la massa di stoccaggio; inoltre usano il metodo della clusterizzazione, che di fatto vincola le modalità di utilizzo dei dati.
Con l’introduzione del sistema Hadoop, si crea invece un meccanismo che non è relazionale e che permette di poter utilizzare i dati e le i
nformazioni più volte e di correlarle tra loro in modi sempre differenti. Il sistema rende ogni dato persistente, ovvero stoccato ma non clusterizzato e quindi estraibile di nuovo in ogni momento; inoltre ha velocizzato il processo di estrazione dei dati e abbassato i costi di storage.
Tipologie di dati
I dati a cui si è fatto riferimento possono essere raggruppati in tre tipologie:
- Human generated data: tutti i dati che ognuno di noi produce quotidianamente durante la sua vita. Ogni volta che si condivide una foto, si svolge una ricerca su Google o si usa la carta fedeltà nei negozi, si forniscono indirettamente migliaia di informazioni personali. Esse comprendono i nostri gusti o i nostri interessi, ma anche le abitudini di acquisto o i dati anagrafici.
- Machine generated data: tutti i dati che vengono prodotti da sorgenti quali segnali GPS, sensori ambientali o metereologici, dispositivi biomedici, l’Internet of Things, o l’High Frequency Trader nei mercati finanziari.
- Business generated data: i dati che vengono prodotti internamente all’azienda, quali ad esempio gli ordini di acquisto e vendita.
Gli Human Generated Data
Gli human generated data sono i più importanti e tra questi ricoprono un ruolo cruciale i dati personali. Più delle informazioni anagrafiche, infatti, il valore maggiore risiede nelle informazioni su gusti, abitudini e passioni. Ovvero tutte quelle informazioni che riguardano la sfera privata della vita di un individuo. Un esempio di dato valuable in tal senso è rappresentato dall’ultimo libro letto o viaggio intrapreso.
Sfruttando i dati human generated le aziende hanno cambiato molto la loro operatività. In primis, la segmentazione degli utenti oggi si basa sugli eventi, ossia le azioni compiute da un individuo (come un click di like su Facebook o una ricerca su Google). I comportamenti individuali divengono dei veri e propri dati che gli algoritmi analizzano e raggruppano. Ogni informazione personale diventa sempre più importante per poter prendere le più proficue decisioni aziendali.
Il valore dei dati
A dimostrazione del valore dei dati, pensiamo ai numerosi servizi gratuiti che ci vengono offerti, soprattutto online, previa compilazione di schede contenenti i nostri dati personali.
Un altro esempio è rappresentato dalle applicazioni di fitness: pensate per aiutare le persone a mantenersi in forma, esse registrano continuamente le nostre azioni, dal numero di passi fatti agli alimenti che mangiati e inviano all’azienda tutte le informazioni raccolte.
Le 5 V dei Big Data
Per descrivere i big data si ricorre alle 5 “V”, ossia alle diverse dimensioni che ha raggiunto la gestione delle informazioni raccolte:
- volume: la quantità di dati che viene creata a livello globale è in continua crescita. Ha raggiunto una quantità nell’ordine degli zettabyte (ovvero miliardi di terabyte) e richiede capacità di elaborazione sempre più complesse. La forte presenza della tecnologia nelle nostre vite fa si che le interazioni sociali si risolvano, nella gran parte dei casi, in un incessante scambio di informazioni, che contribuisce ad aumentare le masse di dati disponibili.
- varietà: i dati che vengono generati sono sempre più eterogenei in termini di formato. In particolare, si distinguono strutturati, semi-strutturati, destrutturati. I dati strutturati sono conservati in database e organizzati secondo schemi e tabelle rigide;invece, i dati destrutturati sono ad esempio immagini, video o e-mail, che sono conservati senza alcuno schema; infine, i dati semi-strutturati presentano caratteristiche proprie di entrambe le tipologie precedenti.
- velocità: i dati sono generati sempre più velocemente e con maggior frequenza e devono poter essere analizzati in tempo reale.
- valore: si riferisce alla capacità di trasformare i dati in valore. I dati hanno un grande valore soprattutto per le aziende, che basano parte delle proprie decisioni di business sulla loro analisi e che grazie ad essi riescono a predire gli andamenti della domanda e del mercato.
- veridicità: è importante valutare la veridicità dei dati che si stanno analizzando; operare su dati falsati significa rischiare di prendere decisioni di business sbagliate.
Analisi dei Big Data
Possedere dati non è però sufficiente: bisogna saperli analizzare, estrapolarne il valore. Grazie alla big data analytics le aziende individuano le nuove opportunità, ottengono profitti maggiori e aumentare la soddisfazione dei clienti.
La big data analytics si divide in:
- analisi descrittiva: utilizza l’aggregazione e la ricerca dei dati per analizzare il passato; aiuta a rappresentare e descrivere graficamente gli aspetti numerici di specifiche situazioni o processi.
- analisi predittiva: utilizza una serie di modelli statistici e tecniche matematiche, quali regressione e proiezione dei dati, che consentono di prevedere scenari di sviluppo nel futuro.
- analisi prescrittiva: oltre le due tecniche precedenti, comprende strumenti che sono in grado di raccomandare una serie di comportamenti, indicandone anche le rispettive conseguenze. Nel dettaglio, si elaborano i dati che derivano dal processo di analisi descrittiva e di analisi predittiva e si generano indicazioni strategiche.
- analisi automatizzata: prevede, al verificarsi di specifiche condizioni, l’attuazione in modo automatizzato di determinate azioni. Un esempio di analisi automatizzata la si trova nell’industria 4.0, dove, grazie all’utilizzo dei dati, è stato possibile creare robot “intelligenti” in grado di cambiare la loro produzione in tempo reale in base ai risultati delle analisi che ricevono.
I settori influenzati dai Big Data
Tra gli ambiti maggiormente colpiti dalla rivoluzione dei big data troviamo il settore del marketing e delle promozioni. Se in passato le pubblicità avevano principalmente la forma di mass advertising, per mezzo di manifesti e spot pubblicitari, oggi i big data permettono di creare pubblicità sempre più mirate, che sono indirizzate alla persona giusta, al momento giusto, nel posto giusto.
Si pensi a quando si cerca un volo aereo su Google. Pochi minuti dopo, aprendo Facebook, appare la pubblicità di un albergo situato in quella stessa località. E’ un esempio concreto di utilizzo della tecnologia dei big data, alla cui base si trovano gli algoritmi che studiano le abitudini individuali e riescono a proporre la scelta più adatta ad ognuno.
Vi sono altri settori nei quali si evidenzia quanto sia cruciale l’uso dei big data, quali l’ambito medico, manifatturiero o ancora il mondo dell’Internet of Things. Anche gli istituti finanziari, dalle banche alle assicurazioni, sfruttano le potenzialità dei big data: le prime per operare una più precisa valutazione del merito creditizio dei clienti, i secondi per offrire polizze personalizzate.
I big data hanno assunto un’importanza sempre maggiore e sono oggi perfettamente radicati nella vita di tutti. Le aziende sono le realtà che ne hanno tratto i maggiori benefici: grazie alla big data analytics sono infatti in grado di prendere decisioni più accurate e di soddisfare meglio le esigenze dei consumatori. A dimostrazione del loro valore, i dati sono stati definiti “the oil of the future information society”.
Per approfondire l’argomento vi aspettiamo dal 6 all’8 novembre al Salone dei Pagamenti di Milano, dove saremo presenti con il nostro desk. Registrati gratuitamente a questo link!