web analytics
back to top

Il ruolo degli analytics tra fake news e sentiment analysis

Data:

I dati oggi hanno acquisito un ruolo sempre più importante in qualsiasi settore. Federico Alberto Pozzi di SAS ci parla del crescente ruolo degli analytics per contrastare il fenomeno delle fake news e per migliorare la sentiment analysis.

I dati oggi hanno acquisito un ruolo sempre più importante in qualsiasi settore. L’evento SAS, Analytics Experience 2017 ad Amsterdam, ne ha dato un’ampia dimostrazione, mettendo in evidenza come l’analisi dei dati non abbia più confini e che anche le associazioni benefiche ed umanitarie possono utilizzarla per conoscere fino in fondo i settori che fanno parte del loro raggio di azione o per sperimentare una modalità di raccolta dei dati più dinamica e mobile. In questo contesto, anche di fronte all’emergere di Intelligenza Artificiale e Machine Learning, il tocco umano, o meglio “il giudizio umano” come lo ha definito Ajay Agrawal dell’Università di Toronto, avrà ancora il suo ruolo fondamentale.

E, a proposito di Intelligenza Artificiale e di Machine Learning, si parla sempre più spesso di sentiment analysis, quasi a voler rendere più automatizzata l’analisi dei testi che è diventata sempre più importante proprio nell’era dei Social Media. Per certi versi, la sentiment analysis si lega anche ad un altro grande tema delle fake news, delle “bufale” che tanto hanno caratterizzato questo ultimo anno. Il proliferare di contenuti sul web e sui social media impone oggi un nuovo modo di analizzare i dati per offrire quell’accuratezza che oggi è necessaria per dare una migliore comprensione dei testi. Comprensione che, anche in un contesto di business, diventa fondamentale per prevedere fenomeni che possono coinvolgere la propria azienda.

fake news sentiment analysis

In occasione di Analytics Experience 2017 ad Amsterdam abbiamo avuto il piacere di incontrare Federico Alberto Pozzi di SAS che su sentiment analysis, analytics e social network ha scritto anche un libro “Sentiment Analysis in Social Networks” e ci aiuta a capirne di più in questa intervista.

Fake News e business. In che modo le aziende possono difendersi dalla Fake News?

Esiste una forte relazione tra Fake News e mondo del business. Un esempio può essere quello di British Petroleum ha disperso in mare milioni di litri di carburante, di conseguenza, di fronte ad una notizia come questa, chiunque, considerando modelli finanziari, si attenderebbe che i prezzi scendano. Se il modello finanziario riesce a prevedere ad esempio il prezzo delle azioni di domani anche in situazione di news negative si dovrebbe riuscire ad attutire eventuali conseguenze negative in poco tempo e fare una previsione di prezzo più corretta. La finanza ha ormai iniziato tenere in forte considerazione le news certificate, quelle diffuse da organi e agenzie di stampa riconosciute. Però hanno anche capito che se si fossero spostate sui social media, nel momento in cui si diffondevano notizie sulla propria azienda, avrebbero avuto accesso alle news ancora prima, solo che questo passaggio può creare effetti disastrosi. Per questo motivo bisogna combattere in tutti i modi il fenomeno delle fake news, in grado anche di mettere in difficoltà i modelli finanziari.

E in che modo SAS può essere utile alle aziende per difendersi da questo tipo di fenomeno?

Le fake news sono solitamente un testo e SAS ha tutta una serie di capabilities e di strumenti per gestire il testo, come la tesxt analytics. Attraverso questo modello, SAS è in grado di analizzare il testo con la sentiment analysis e quindi capire se il testo è positivo o negativo e di cosa si sta parlando. Il modello alla base è quindi sempre quello di text analytics con obiettivi differenti: riuscire a capire di cosa si sta parlando, se si tratta di un testo fake. Prova a pensare una sentiment analysis sul tema iPhone, si osserverebbe sempre un aspetto positivo sul dispositivo (è bello) e sempre un aspetto negativo (costa troppo).

E come lavora il sistema?

Il primo passaggio è quello di basarsi su regole semantiche, il secondo passaggio si basa invece sugli analytics e machine learning. Per comprendere meglio che cosa significa tutto questo faccio sempre l’esempio del bambino. Un bambino, infatti, non sa nulla del mondo, impara a conoscere il mondo osservandolo. Ma ipotizziamo un giorno che tu gli faccia vedere una penna, dicendogli “questa è una penna”, bene. Il giorno dopo gli fai vedere un’altra penna, dicendogli sempre “questa è una penna”; il giorno successivo gli fai vedere una stilografica e gli dici sempre “questa è una penna”. In questo modo non stai spiegando al bambino le differenze tra le diverse penne, ma lui stesso, osservandole, impara a coglierle. Nel momento in cui gli fai vedere una matita, e mai prima di quel momento ne ha vista una, lui molto probabilmente ti dirà che quella è una penna ma un po’ diversa dalle altre. E allora cominci a fargli vedere tutte le matite e lui inizia a comprendere la differenza tra le penne e le matite. Ma se lui non avesse mai visto prima una penna, non sarebbe in grado di capirne le differenze.

Questo esempio è utile per comprendere il machine learning. Quindi tu dai alla macchina (il bambino) una serie di osservazioni dicendogli che cosa sono, senza dirgli quali sono le differenze, la macchina impara a distinguerle. E quando poi tu in futuro gli mostrerai una penna, ma un po’ diversa da quelle che gli hai mostrato prima, lui non avrà difficoltà a dirti che quella è una penna. Lo comprende anche senza che tu gli dica che quella è una penna. Questo è il paradigma del machine learning analytics. Il paradigma invece delle regole semantiche prevede, restando sempre sull’esempio della penna che se tu dici alla macchina che quella a forma cilindrica, con un cappuccio e inchiostro nero è una penna, il sistema lo memorizza come penna; ma se tu gliela mostri poi, ad esempio, con inchiostro rosso, il sistema non capisce più che è una penna, perchè la regola diceva che per essere una penna deve essere nera. Questo è un esempio di regola molto restrittiva e costituisce uno svantaggio delle regole semantiche rispetto al machine learning, nel senso che, con regole molto precise, il rischio è che il sistema non riesca a riconoscere un oggetto nel suo insieme.

Il text analytics è la stessa cosa. Nel senso che tu puoi dare una serie di testi in pasto alla macchina (al bambino) e dargli tutte le indicazioni se “questo è positivo, negativo, neutrale” e così via. Il sistema analizzando le parole inizierà a comprendere, ad esempio, che le parolacce compaiono più spesso nei documenti negativi, è una cosa che lui impara osservando i testi. E quindi, rendendo tutto più semplice, quando si troverà di fronte ad un testo con tante parolacce, dirà che quello è un testo negativo. Dal punto di vista, invece, del paradigma delle regole il discorso cambia. Nel senso che al sistema darai tutta una serie di parole, specificando anche che se prima di quella parola vi è una negazione allora va considerato in un certo modo. Si tratta quindi di un sistema più articolato e difficile, perchè si deve costruire un motore per ogni idioma, che ha, a sua volta, un suo sistema di regole che non valgono per le altre.

Dal lato del machine learning, sempre con l’obiettivo di sapere se un testo è negativo, neutro o positivo parlando di politica o di sport, si dovrebbe dare in pasto alla macchina una grande mole di testi e nel momento in cui la macchina dovesse trovarsi di fronte ad un testo che non comprende gli argomenti che tu gli hai segnalato in precedenza, non saprà distinguerlo.

E i social media in tutto questo?

Sui social media sai bene che si parla di qualsiasi cosa. Prova ad immaginare un analista che deve scrivere delle regole semantiche per quei canali, praticamente non finirebbe mai, perchè ne esistono tante e cambiano anche di continuo. Sono sistemi complessi, dei sistemi aperti. E’ un continuo procedere con regole complesse e non finite che non rispondo ad un idioma preciso. Pensa, ad esempio, all’uso delle emoticon.

Immaginando un sistema di sentiment analysis sui social media, il cui obiettivo è quello di determinare se un testo è positivo, neutro o negativo, il lavoro da fare sarebbe complesso. E’ difficile stabilire se ci si trova di fronte ad un post o ad un tweet ironico o sarcastico, molto difficile. Come sai sui social media sono molto utilizzate le emoticon, anche in situazioni di sarcasmo, questi potrebbero rivelarsire di aiuto a comprendere un contenuto, mettendo insieme tutta una serie di elementi.

Dalla tua spiegazione ci si rende conto che effettivamente è molto difficile fare sentiment analysis sui social media, anche se sono sempre di più le aziende che adottano questi canali per comunicare in modo diretto con i propri clienti. In questo ultimo periodo ci sono modelli di sentiment analysis che utilizzano l’Intelligenza Artificiale, come vedi tu questo approccio?

E’ vero, siamo di fronte ad uno scenario in cui aumentano le conversazioni sui social media, di conseguenza aumenta il volume dei contenuti da analizzare. Al momento l’approccio di sentiment analysis attraverso l’Intelligenza Artificiale non è detto che sia il solo o il più affidabile. C’è da tener presente anche che tutte le analisi si basano sullo studio dei testi e sullo studio sui grafi, come quello di Facebook e di Twitter, per esempio. Su Facebook l’amicizia instaura un rapporto bi-direzionale, mentre su Twitter in genere ha un’unica direzione, nel senso che io posso seguire un utente ma questi non necessariamente deve seguirmi. Possiamo analizzare la qualità delle relazioni in base alle condivisioni che un utente fa dei contenuti di un altro. Immaginiamo che un utente condivida molti contenuti di un altro, questi automaticamente fa scattare una relazione di condivisione del contenuto stesso. Se si condividono tanti contenuti su un dato argomento, con un’opinione positiva, la stessa condivisione di quei contenuti significa anche che quell’utente la pensa allo stesso modo. Anche senza analizzare la relazione, è facile rilevare, proprio dal grafo, che quell’utente sta condividendo, quindi approvando, l’ opinione positiva su quel dato tema. Quello che voglio dire è che si sta cercando di arricchire lo studio del text analytics con lo studio della rete sociale, nel tentativo di aggiungere tanti elementi per ottimizzare il modello di text analytics.

Va detto che il modello più semplice di sentiment analysis è quello “dictionary based”, con il quale si fa un’analisi basata proprio sul dizionario, si va a verificare quindi il significato di ciascuna parola così come riportata all’interno del dizionario. Facciamo un esempio: se in una frase abbiamo tre parole da analizzare, una volta eliminate tutte quelle che non danno significato alla sentiment, come gli articoli, compariamo il loro significato: se due sono positive e una negativa, il valore sentiment sarà positivo; se una è positiva e due sono negative, allora sarà negativo. Anche se spesso vediamo che molte piattaformr individuano per buona parte contenuti neutrali, significa che l’analisi sentiment non è stata fatta fino in fondo.

SAS da questo punto di vista, grazie agli analytics, elabora un modello di sentiment analysis che garantisce una maggiore accuratezza. Come dicevamo prima, una delle maggiori difficoltà del machine learning è che devi scrivere regole per tutto, diventa quindi un lavoro enorme. Il modello elaborato da SAS invece è più avanzato ed è in grado i comprendere da solo anche situazioni particolari, gli analytics aiutano tantissimo.

L’intervista a Federico Alberto Pozzi, che ringraziamo ancora una volta per la sua disponibilità, ci mostra la complessità nel fare sentiment analysis, specie se questa viene messa in relazione ai social media. La sentiment analysis avrà sempre più un ruolo decisivo nella comprensione dei testi creati e condivisi sui social media, di certo, ed è quello che ci diceva Pozzi, serve un modello più articolato, fatto di tanti elementi. La stessa Intelligenza Artificiale non sarebbe esaustiva fino in fondo presa in assoluto. Ecco, questo è sicuramente un aspetto che fa un po’ di chiarezza, di cui avevamo in effetti bisogno.

author avatar
Franz Russo Blogger, Digital Strategist
Franz Russo, fondatore, nel 2008, del blog InTime, ho collaborato con grandi aziende nazionali e internazionali, come consulente per strategie di comunicazione e come divulgatore. Da sempre impegnato nella comunicazione digitale, cerco di unire sempre una profonda passione per l’innovazione tecnologica a una visione olistica dell’evoluzione dei social media e degli strumenti digitali. Il mio percorso professionale in questo campo, iniziato nel 2007, è stato caratterizzato da un costante impegno nel raccontare e interpretare i cambiamenti nel panorama digitale. Il mio approccio si basa su un mix di analisi strategica, creatività e un profondo impegno per il racconto e la divulgazione.
La tua iscrizione non può essere convalidata.
La tua iscrizione è avvenuta correttamente.

InTime Blog Newsletter

Abbonati alla newsletter e resta aggiornato su articoli e approfondimenti 

Utilizziamo Brevo come piattaforma di marketing. Inviando questo modulo, accetti che i dati personali da te forniti vengano trasferiti a Brevo per il trattamento in conformità all'Informativa sulla privacy di Brevo.

Scrivimi

Se ti piace quello che scrivo e se vuoi conoscermi meglio, clicca il bottone qui di fianco.

1 commento

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui

venerdì, 19 Aprile, 2024

Ultimi articoli

InTime Podcast

spot_img

Articoli correlati
Related

TikTok prepara la sfida a Instagram con TikTok Notes

TikTok sta testando TikTok Notes in Australia e Canada. Una app che copia Instagram, concentrando l'attenzione sull'immagine piuttosto che sul video.

L’emergere del ruolo del responsabile IA nelle aziende

Si chiama Chief Artificial Intelligence Officer (CAIO), responsabile della Intelligenza Artificiale. Guida all'utilizzo della IA nelle aziende.

Su X i nuovi utenti dovranno pagare per scrivere

Elon Musk ha proposto una piccola tariffa annuale per i nuovi utenti di X per contrastare i bot. Iniziativa che ha suscitato polemiche.

Instagram oscurerà le immagini di nudo nei messaggi

Instagram avvia un test che oscurerà le immagini di nudo inviare attraverso messaggi privati. Un modo per proteggere i più giovani dal sextorsion.