Cerrar panel

Cerrar panel

Cerrar panel

Cerrar panel

Tecnología Act. 08 ago 2017

LiMoSINe: agregación semántica para mejorar el análisis de la reputación online

El Proyecto LiMoSINe es una iniciativa destinada a encontrar nuevas formas de filtrar la reputación de una marca en las redes sociales mediante agregación semántica.

reputacion online, limosine, ordenador, portátil, recurso, bbva

Si cualquiera de nosotros se encontrase con un tuit con el texto "¿Yo? Si soy el fan número 1 de Vicente. ¿No se me nota? :P", primero se encontraría con una duda: ¿De qué Vicente está hablando? No tendríamos mucho problema en saberlo si identificamos el contexto (por ejemplo, en el marco de un debate sobre el estilo de juego de la Selección Española de fútbol, probablemente se trate de una referencia a Del Bosque). Con el sentido del tuit en sí habría menos dudas: el tono irónico es evidente.

Sin embargo... ¿un buscador como Google ofrecería este tuit como resultado en una búsqueda sobre Vicente del Bosque? Y una aplicación cualquiera de análisis de la reputación online... ¿identificaría como negativo este tuit? Al fin y al cabo el texto "Soy el fan número 1 de Vicente" posee para cualquier software una apariencia engañosamente positiva.

Y es que uno de los grandes problemas a la hora de analizar el contenido de Internet es su ambigüedad semántica.

Proyecto LiMoSINe

Conscientes de este problema, a finales del año 2011 se unieron cinco universidades (la Universidad de Amsterdam, la de Glasgow, la de Trento, la Universidad Nacional de Educación a Distancia y la Universidad Pompeu Fabra a través de su fundación Barcelona Media) y dos empresas (Yahoo! Barcelona Media Research Center y Llorente&Cuencapara poner en marcha el Proyecto LiMoSINe (siglas en inglés de “Motores de agregación semántica por motivación linguística”), una iniciativa destinada a encontrar nuevas formas de filtrar la reputación de una marca en las redes sociales mediante la agregación semántica.

Concretamente, son tres los objetivos de Limosine:

  • Ser capaces de entender qué dicen los textos, a quién se está haciendo referencia y qué clase de relaciones se establecen entre las personas y las organizaciones mencionadas.
  • Encontrar y entender información implícita, lo que implica estar analizando millones de textos de manera constante: como hemos visto, en el caso de la reputación online, esta información implícita es algo que no se desprende de un solo texto y sí de un conjunto enorme de información (conversaciones, enlaces, etc.).
  • Poder utilizar toda esa información para crear nuevos sistemas de búsqueda de datos, llegando a donde los buscadores tradicionales no han conseguido llegar hasta el momento.

LiMoSINe está financiado por la Unión Europea (concretamente por el por el Séptimo Programa Marco de la Comunidad Europea) y participan en él investigadores destacados como el especialista en recuperación de información y estructuras de datos Ricardo Baeza-Yates, quien además ocupa en Yahoo! el cargo de vicepresidente de Investigación para Europa y Latinoamérica.

infografia-limosine-bbva

Proyecto Limosine

Iniciativa RepLab

Dentro de este proyecto se encuadra la iniciativa RepLab (promovida por la UNED, la UvA y Llorente & Cuenca) encargada específicamente de elaborar un software basado en la agregación semántica que sea capaz de procesar el lenguaje natural y, así, poder comprender así los textos de la WWW, incluyendo aquellos comentarios e información que los usuarios suben a las redes sociales. Éste es un paso fundamental para poder aplicar la minería de datos que sirva para establecer la reputación del producto / empresa / individuo.

Este año se organizará un evento RepLab 2014 como actividad de la Conferencia CLEF 2014, un congreso anual dedicado a promover el I+D+i en torno a sistemas de acceso a la información multilingüe y multimodal. En 2012 y 2013, el evento RepLab se centró en aspectos como la vigilancia de la reputación corporativa en Twitter y abordó asuntos como la desambiguación de nombres, la polaridad de la reputación y la categorización de los temas de los mensajes, y de la relevancia de los mismos. Por contra, en 2014 se centrará en categorizar los tuits en base al modelo TREC Microblog Track, así como en detectar la profesión y el grado de influencia de los autores de los mensajes.