Buscar

Minería de Redes Sociales

Las redes sociales tienen un gran atractivo ya que generan una gran cantidad de datos diariamente: reacciones, comentarios y publicaciones compartidas. Con el uso y cruce de estos grandes volúmenes de información podemos realizar un análisis de sentimiento de los usuarios hacia los posteos de nuestro cliente y brindarle valiosa información. Suponiendo, por ejemplo, que nuestro cliente fuera un candidato político, podríamos decirle:

  • Sobre qué temas hablan y con qué frecuencia

  • Cuál de estos temas le interesa más a sus seguidores y cuáles menos

  • Sobre qué se quejan sus seguidores

  • De qué hablan otros candidatos

  • Qué le reclaman a otros candidatos

  • Análisis de sentimiento

  • Cantidad de comentarios, likes y compartidos

Facebook, Instagram, Twitter y el resto de estas plataformas se han convertido en una herramienta muy interesante de comunicación. Las redes sociales y la comunicación política tienen que ir ligadas para lograr mayor eficacia en las campañas electorales. El objetivo es que nuestro cliente aproveche los datos para hablar sobre los temas que más potencial tienen y generar debate sobre los asuntos que preocupan a los seguidores de otros candidatos.

¿Cómo extraemos e interpretamos todos estos datos? A través de librerías para hacer wrapping consumimos servicios REST para almacenar la información capturada diariamente en base de datos. Además, aplicamos técnicas de minería de datos, aprendizaje estadístico y procesamiento del lenguaje natural para obtener indicadores y clasificar la información de los posteos que nos interesen.

Este proceso nos sirve para saber sobre qué temas y con qué frecuencia habla cada candidato en sus redes sociales en un rango de fechas determinado. Los temas son clasificados y se saca un porcentaje de cuáles son los asuntos que predominan. Veamos algunos ejemplos de estos análisis aplicados a casos reales:

Esta información nos permite identificar si los usuarios están interesados en estos temas o si deberían modificarse los mensajes para conseguir más apoyo. Podemos observar que en Instagram la Persona N° 3 habla mucho sobre política, pero los posteos que más likes tienen son los que se relacionan a su vida personal.

El mismo proceso realizamos para Facebook y analizamos la distribución de reacciones según el tema del posteo. En el gráfico se ve claramente como la Persona N° 3 tiene la mayor distribución positiva para los posteos relacionados con obras y lo negativo se destaca en el contenido de preguntas y respuestas en vivo, eventos que se convirtien en un depósito de quejas y reclamos hacia la gestión.


Distribución de reacciones por tema de publicación

Persona N° 3 Persona N° 4

Distribución de reacciones por tema

Persona N° 3 Persona N°4


Resulta útil también analizar de qué se están quejando. Con las respuestas creamos wordclouds para conocer las palabras que más utilizan las personas que comentan. Este es un ejemplo que hicimos con las menciones a la Persona N° 2 durante el 10 al 16 de septiembre 2018:

Un detalle técnico: en la franja superior, las menciones están ponderadas según la cantidad de favoritos que tengan. Hacer este trabajo o no marca una gran diferencia. Sin ponderar, como vemos en la franja inferior las palabras más utilizadas son CHORRA y LOCA, pero al ponderar las respuestas se ve cómo toma relevancia la palabra FUERZA. Esto significa que algunos escribieron FUERZA y muchos otros le dieron favorito a este tipo de mensaje. Quizás, en este caso fueron más los usuarios que prefirieron apoyar con un me gusta desde el silencio sin escribir un mensaje, lo cual sí hicieron quienes se pronunciaron en contra.


En relación a esto último, el análisis de sentimiento hacia un posteo tiene ciertas consideraciones técnicas que no son necesariamente tan obvias como comparar cantidad de comentarios positivos contra negativos. En muchos casos, los usuarios reaccionan positivamente principalmente a través de los favoritos y me gusta, mientras que los que se expresan en contra principalmente eligen los comentarios. Veamos un ejemplo:

Se puede observar que en los tweets 1, 2 y 4 si nos guiamos por los comentarios predomina el sentimiento negativo, pero ponderando los favoritos el sentimiento con más fuerza es el positivo. Siguiendo nuestra explicación, los sentimientos negativos se reflejan más en los comentarios mientras que los positivos se ven en los favoritos.


En el mundo empresarial se puede hacer este tipo de análisis aplicando la misma lógica. Delta Airlines lo utilizó para descubrir cuáles eran las quejas más frecuentes de sus usuarios, lo cual se desprende fácilmente de una clasificación de respuestas, menciones en la red y wordclouds. Les dejamos un resumen de otras aplicaciones posibles:


#Wrapping #RedesSociales #ComunicaciónPolítica #Votos #APIs #Datos #AprendizajeEstadístico #AprendizajeAutomático #NLP #WordCloud #Twitter #Facebook #Instagram #DataBase

184 vistas