Pagine

venerdì 3 agosto 2012

Intervistato.com | Vincenzo Cosenza @vincos

Qualche tempo fa abbiamo intervistato Vincenzo Cosenza aka Vincos, social media strategist in BlogMeter: abbiamo parlato di analisi del sentiment, big data, strumenti di analisi e dell'evoluzione del panorama dei social network.


Innanzitutto abbiamo chiesto a Vincenzo quali sono i parametri presi in considerazione per la valutazione del sentiment dei singoli post. Il tipo di approccio utilizzato è il cosiddetto rule-based, un motore di ricerca che raccglie i post e i messaggi in rete sulla base delle parole chiave che interessano. I testi vengono poi sottoposti al vaglio di una serie di regole sintattiche e grammaticali definite da un apposito team di linguisti computazionali. [video]

Per quanto riguarda la gestione di omonimia e polisemia, esiste un set di regole, un modulo ad hoc nel sistema che appunto è votato a risolvere i problemi riguardanti questi due casi particolari. [video]

Un'altra domanda riguarda l'aggiornamento degli algoritmi di computazione del linguaggio in un momento in cui la lingua evolve tanto rapidamente. Vincenzo ci ha rivelato che il processo viene portato avanti manualmente dai linguisti: il problema vero è che la lingua che noi parliamo sul web ha caratteristiche peculiari che la rendono complessa da far “digerire” ad una macchina. [video]

Sarcasmo ed ironia rappresentano l'aspetto più difficile della sentiment analysis: sono stati effettuati tanti studi in merito, e la soluzione trovata è quella di seguire non solo un approccio basato su regole aggiornate costantemente, ma anche di integrare una serie di indagini a campione, per capire se effettivamente la macchina sta comprendendo adeguatamente i messaggi oppure no. Si ha in ogni caso una percentuale di errore, ma questa può essere sensibilmente ridotta con la lettura “manuale”. [video]

La percentuale di errore dipende in larga scala da un unico fattore: se l'analisi ha un campo semantico ben definito oppure no. Nel primo caso, in cui i messaggi possono trattare qualsiasi argomento, la precisione è del 84% per il sentiment. Quando invece il campo semantico è ben definito, si va ben oltre il 90%. [video]

Ci sono diversi studi che affermano che con una adeguata analisi del sentiment su Twitter sia possibile prevedere l'andamento delle borse con 5 giorni di anticipo: Vincenzo ha seguito con attenzione questi studi, ma a suo avviso sono per la maggior parte poco convincenti. L'unica cosa che realmente sappiamo è che ci sono società che fanno questo di mestiere, ma per la sua esperienza sa che si tratta di analisi molto complesse, la cui reale fattibilità è incerta. Viceversa, sono molto interessanti le ricerche che legano il successo al botteghino di un film al sentiment degli utenti sui social media subito prima dell'uscita o subito dopo: si tratta in questo caso di fenomeni di correlazione ben più attendibili. [video]

Infine abbiamo chiesto quale sa il social network che Vincenzo preferisce, e per quale ragione: ci ha rivelato che non ha un social preferito, ma è legato a Facebook in quanto ha iniziato a studiarlo tanti anni fa, quando in Italia veniva snobbato e considerato un social network per ragazzi. Li usa tuttavia indistintamente, e grazie al suo lavoro ha la possibilità di testarne anche più di uno per capire quale possa essere adeguato a seconda delle esigenze. [video]

In chiusura abbiamo chiesto come stanno evolvendo i social, seguendo un modello globalizzato oppure uno glocalizzato: Vincenzo è del parere che a prevalere sia il primo modello, che peraltro si sta diffondendo sempre di più. Attraverso la mappa dei social media che egli stesso ha costruito, ciò che emerge è che sempre di più esiste un leader forte in ogni nazione, e al momento nella maggior parte dei casi si tratta di Facebook. Quando ciò non avviene, è solamente per motivi politici.

Ad ogni modo Vincenzo è convinto che ci sarà sempre spazio per i social network locali che sappiano interpretare bene le esigenze di una determinata popolazione. Accanto a Facebook le persone useranno anche il social network locale. Gli stessi Twitter e Linkedin, che hanno una presenza a livello globale, non stanno morendo a seguito del grande boom di Facebook: vivono perché riescono a trovare una nicchia di collocamento che gli altri social non hanno trovato. [video]

Vi invito a visionare l'intervista integrale, molto più ricca di contenuti di questa mia breve sintesi.

Buona visione!

Maria Petrescu | @sednonsatiata



Intervistato.com | Vincenzo Cosenza

Some time ago we interviewed Vincenzo Cosenza aka Vincos, social media strategist in BlogMeter: we talked about sentiment analysis, big data, analysis tools and the evolution of the social network scenario.

First of all we asked Vincenzo what are the parameters that are taken into consideration in the sentiment evaluation of individual posts. The type of approach that is used is rule-based, a search engine that gathers posts and messages online based on keywords that are of interest for that particular analysis. The text is then examined with a series of syntactic and grammar rules defined by a team of computational linguists. [video]

As for the management of omonymy and polysemy, there is a set of rules, a dedicated module in the system that has the goal of solving problems regarding these two particular cases. [video]

Another question we asked was about the updating of the computation algorithms of language in a time when languages evolves so rapidly. Vincenzo has revealed that the process is carried on by linguists "by hand": the real problem is that the language we use on the web has peculiar characteristics that make it very complex to manage by a machine. [video]

Sarcasm and irony represent the most difficult aspect of sentiment analysis: there have been made many a study about them, and the solution that has been majorly adopted is an approach based on constantly updated rules, but also a series of sample surveys, in order to understand whether the machine is actually understanding the messages properly or not. There is a percentage of error in any case, by it can be lowered significantly with a human reading. [video]

The error percentage depends largely on one factor: whether the analysis has a well define semantic field or not. In the first case, in which messages can treat any topic, the precision is about 84% for sentiment. When the semantic field is well defined, precision goes well over 90%. [video]

There are several studies that state that, with an adequate analysis of sentiment on Twitter it is possible to know how financial markets will vary 5 days in advance: Vincenzo has carefully been following these studies, but he believes they're not very convincing. The only thing we really know is that there are companies that do this as their core business, but in his experience these are very complex analyses, and the results uncertain. On the other hand, there is some extremely interesting research that analyze the tie the success of a movie to the user sentiment on social media right before or right after the movie is launched: in this case the correlation is much more reliable. [video]

Finally we asked what is the social network that Vincenzo prefers and for what reason: he said that he has no favorite social, but he is fond of Facebook because he started studying many years ago, when in Italy it was still considered a social network for kids. He uses indistinctly, and thanks to his job he has the possibility to test them in order to understand which one is the most adequate based on needs. [video]

We also asked how social media are evolving, whether following a globalized or glocalized model: Vincenzo believes that the first model is prevailing, and is spreading more and more. Thanks to the social media map that he build, he discovered that the trend is to have a stronger leader in every nation, and at the moment, in the majority of cases, that leader is Facebook. That doesn't happen in just a few countries, and mainly for political reasons.

Anyhow Vincenzo is convinced that there shall be always space for local social networks that know how to interpret the needs of a certain population. Next to Facebook, people will also use the local social network. Even Twitter and Linkedin, that are present at a global level, aren't dying because of the great Facebook boom: they live because they found a niche that other socials haven't found. [video]

I invite you to view the full interview, much richer in content than my brief synthesis.

Enjoy!

Maria Petrescu | @sednonsatiata

Nessun commento:

Posta un commento