Google Research Award al catanzarese Paolo Ferragina

Catanzaro Attualità

È stato assegnato al catanzarese Paolo Ferragina, ordinario di Algoritmi presso il dipartimento di Informatica e prorettore per la Ricerca applicata e l'innovazione dell'Ateneo di Pisa, un prestigioso Google Faculty Research Award 2013, premio destinato a finanziare progetti di ricerca innovativi nell'ambito ICT così da, come riporta il sito del premio, "sostenere il lavoro di eccellenti ricercatori delle migliori università del mondo". Il progetto presentato dal professor Ferragina, dal titolo "A novel graph for social-network analysis and search built by entity-annotators, and its applications", è la naturale continuazione di un altro progetto presentato nel dicembre del 2010 e che aveva ricevuto anche allora un Google Award.

Alla base del primo progetto, a cui hanno collaborato alcuni dottorandi e laureandi del dipartimento di Informatica, vi erano le sfide algoritmiche che riguardavano l'analisi di collezioni massive di testi brevi e disomogenei, quali quelli che tipicamente occorrono nelle Reti Sociali (e quindi, micro-blog, tweet, e anche news). Lo studio aveva portato alla progettazione e realizzazione di un nuovo algoritmo, denominato TAGME (http://acube.di.unipi.it/tagme), in grado di identificare in quei testi sequenze significative di termini (dette anche menzioni) e di annotarle con entità che ne descrivono il significato, queste ultime rappresentate mediante pagine di Wikipedia. TAGME è oggi l'annotatore semantico più efficiente ed efficace noto in letteratura, specializzato su collezioni di testi brevi (quali tweet e news), con diverse pubblicazioni su riviste e conferenze internazionali del settore.

La nuova ricerca finanziata, ancora una volta, da Google punta a sviluppare l'uso degli annotatori semantici, tipo TAGME, in modo da poter estrarre una serie di informazioni ulteriori dalle reti sociali (principalmente Twitter e Google+), quali ad esempio entità, hashtag, retweet, geolocalizzazione; e metterle in collegamento tra loro per costruire un nuovo "grafo della conoscenza".

Alcuni studi preliminari svolti su un'ampia porzione italiana di Twitter, costituita da circa 400 mila utenti e più di 300 milioni di loro tweet, hanno già permesso di realizzare un grafo di alcuni milioni di nodi e archi, che nel progetto sarà ulteriormente esteso per raggiungere dimensioni ancora superiori, possibilmente includendo altre nazioni o comunità di utenti. L'obiettivo ultimo del progetto, i cui risultati saranno messi a disposizione della comunità scientifica seguendo i dettami dei riconoscimenti Google, sarà quello di rendere ancora più efficaci alcuni task che oramai sono diventati cruciali per la ricerca, l'analisi e l'accesso alle reti sociali, quali per esempio la valutazione della similarità tra hashtag, la loro classificazione e clustering, la realizzazione di ricerche per similarità e contesto.