TFM: Análisis de frecuencia de hashtags en Twitter


Seguimos fomentando la difusión de los trabajos académicos de los alumnos, como el de José Alberto Pérez Melián

Título: Análisis de frecuencia de hashtags en Twitter

Resumen:

Las redes sociales han transformado la comunicación de manera drástica en los últimos años, a través del auge de nuevas plataformas y el desarrollo de un lenguaje propio de comunicación. Este nuevo panorama digital requiere de nuevas formas de estudio para describir y predecir el comportamiento de los usuarios en la red.

En este trabajo se realiza un análisis del comportamiento de los hashtags en una conversación de Twitter, estudiando cómo se distribuye su frecuencia de acuerdo a su popularidad. Se ha observado que se sigue una distribución potencial, según lo esperado por la Ley de Zipf, que indica que existen pocos hashtags con mucha repercusión y muchos que no han tenido mucho éxito. Debido al comportamiento humano en estas redes, muchos de los hashtags no han alcanzado gran repercusión debido a que contienen alguna falta de ortografía o están mal escritos. Para corregir esto se han utilizado distancias de edición de cadenas que han permitido agrupar los hashtags similares entre sí para disminuir el efecto de los hashtags escritos de manera errónea en los estudios realizados.

También se muestra la aplicación que tiene la Ley de Benford aplicada al estudio del comportamiento de los usuarios en las redes sociales, donde las distribuciones del primer y segundo dígito más significativo de las frecuencias de los hashtags siguen la distribución esperada por Benford. Esto permite que se pueda utilizar para validar datos provenientes de Twitter y analizarlos en busca de comportamientos sospechosos.

Adjuntos