Cos’è la sentiment analysis
La sentiment analysis consiste nell’applicare una procedura che prende il nome di text mining: si tratta di un processo in cui, tramite il machine learning, ovvero l’apprendimento automatico, si tenta di trovare delle informazioni, o di individuare specifici modelli, partendo dall’analisi testuale.
Generalmente la sentiment analysis si focalizza nel determinare l’atteggiamento dell’autore di una data frase scritta online, atteggiamento che viene rivolto ad un argomento specifico, che può essere il giudizio su un brand, una visione politica o lo stato emotivo che genera un fenomeno sociale. Come esempio prendiamo in considerazione un utente Facebook che, subito dopo aver concluso un viaggio, commenta sulla pagina della compagnia di voli di fiducia: «Il volo è stato fantastico. Non vi smentite mai!». Viene analizzata la semantica della frase, la quale è classificata come positiva.
La sentiment analysis procede analizzando commenti, tweets, frasi digitate su Google e così via, in modo da fornire alle aziende la percezione generale che i clienti hanno del brand.
Il compito base della sentiment analysis è quello di classificare una sorta di polarità che i soggetti dimostrano nei confronti di un argomento (nel caso precedente il tema era un brand). Viene creato un indice che associa numeri da “completamente positivo” a “completamente negativo”, passando per valori intermedi i quali rispecchiano la neutralità che un soggetto assume rispetto al tema.
I tipi di sentiment analysis
Gli approcci legati alla sentiment analysis si fondano su tre differenti categorie:
- Rilevamento delle keyword. In questo caso il testo viene analizzato tramite l’individuazione di parole chiave che riflettono lo stato emotivo espresso in esso dall’autore. Verranno dunque tracciate aree semantiche relative a differenti stati emotivi.
- Affinità lessicale. Non si limita a rilevare le keyword emotive, ma arriva ad assegnare alle parole una probabilità di appartenere a particolari emozioni provate dall’autore.
- Metodi statistici. Questa è una parte fondamentale della sentiment analysis, nella quale l’algoritmo cerca di comprendere chi sia il soggetto che prova un determinato sentimento, ed allo stesso tempo l’oggetto verso cui lo prova. Questi approcci vengono definiti metodi statistici in quanto si basano su intervalli probabilistici nei quali sono definite le relazioni emotive all’interno del testo; in altre parole, l’algoritmo non sarà mai in grado di affermare con certezza chi è il soggetto e chi l’oggetto ma, facendo inferenza su di essi, determinerà una probabilità. Per misurare queste probabilità sono usate le relazioni grammaticali tra le parole utilizzate; ciò è reso possibile da una scansione approfondita del testo.
Ovviamente, fin quando si tratta di piccole frasi dal significato inequivocabile, la sentiment analysis è in grado di funzionare perfettamente ed in modo del tutto automatizzato tramite il machine learning. I testi che però devono essere analizzati possono essere più o meno lunghi e contenere componenti tali da indurre ad errore un sistema totalmente automatizzato, che si basa su convenzioni lessicali e semantiche predefinite. Basti pensare al classico atteggiamento ironico dello scrittore. Per fare un esempio può essere utilizzata la frase di prima riguardo la compagnia di voli: «Il volo è stato fantastico. Non vi smentite mai!». Questa potrebbe essere stata scritta in modo ironico da un utente stufo dell’inefficienza della compagnia. In tale contesto un sistema automatizzato, il quale non possiede giudizio soggettivo, potrebbe non cogliere l’ironia della frase, classificandola come giudizio estremamente positivo al brand. In casi come questo è richiesta la componente umana, che è in grado di cogliere le diverse sfaccettature che la frase può assumere.
Le applicazioni
A livello applicativo la sentiment analysis può essere utilizzata nei modi più svariati e non solo per valutare politiche di marketing o il grado di attaccamento ad un certo brand.
Esistono centri di ricerca che sono in grado di valutare intere campagne elettorali, riuscendo a prevedere con un buon grado di significatività l’esito delle elezioni: in questo campo la sentiment analysis si rivela cruciale. Di fatto vengono analizzati tweet, post su Facebook e ricerche Google di milioni e milioni di utenti al fine di ottenere delle previsioni su quale possa essere il profilo che vota un candidato piuttosto che un altro. Ad esempio è stato studiato che quando un utente su Google digita il nome di più candidati, in linea generale è più propenso a supportare il candidato che digita per primo. Questa è solo una delle tante regole associative che si possono applicare al campo politico con l’utilizzo di big data e sentiment analysis. Con “big data” si indica generalmente un voluminoso insieme di dati, strutturati, semistrutturati e non strutturati, i quali hanno un potenziale valore in termini di informazione, sebbene tale termine non abbia ancora una definizione univoca. La sentiment analysis dunque non è che un’applicazione della procedura di text mining a dati di testo, dai quali riesce ad estrapolare informazioni: il ruolo dei big data è basilare per l’effettivo utilizzo della sentiment analysis.
Ma i campi in cui essa viene utilizzata non finiscono qui: basti pensare all’ambito finanziario. Tra gli studi più recenti figurano proprio quelli che si occupano di misurare l’impatto del “sentiment” degli investitori sui prezzi azionari. Valutare questo aspetto può diventare interessante se si analizzano tweet e soprattutto ricerche Google che gli investitori digitano quando pensano alle strategie da attuare nei mercati finanziari. Oppure si può pensare alle svariate applicazioni che la sentiment analysis sta portando nel campo delle scienze sociali, dove viene studiato il profilo psicologico dell’insieme di individui di fronte a fenomeni quali immigrazione o disoccupazione.
Di fronte a questa rivoluzione digitale, un ruolo chiave viene assunto dai dati che gli utenti immettono costantemente in rete. Questi vengono forniti a social network e motori di ricerca e costituiscono uno degli asset di maggior valore, dato il peso strategico che possono assumere rispetto a tantissimi settori, tra cui quelli sopra citati. Da qui nasce un dibattito che si interroga riguardo l’eticità di questo valore che fondamentalmente viene creato grazie alle informazioni personali che gli individui, spesso inconsapevolmente, pubblicano in rete.