Metodología de búsqueda de sub-comunidades mediante análisis de redes sociales y minería de datos

Magíster en Gestión de Operaciones === Ingeniero Civil Industrial === Las redes sociales virtuales posibilitan que participantes de todo el mundo compartan experiencias, opiniones e ideas con otros usuarios de intereses comunes, formando así grandes comunidades. Uno de estos tipos de comunidad son l...

Full description

Bibliographic Details
Main Author: Cuadra Lobos, Lautaro Bartolome
Other Authors: Ríos Pérez, Sebastián
Language:es
Published: Universidad de Chile 2013
Subjects:
SNA
Online Access:http://www.repositorio.uchile.cl/handle/2250/111999
Description
Summary:Magíster en Gestión de Operaciones === Ingeniero Civil Industrial === Las redes sociales virtuales posibilitan que participantes de todo el mundo compartan experiencias, opiniones e ideas con otros usuarios de intereses comunes, formando así grandes comunidades. Uno de estos tipos de comunidad son las comunidades virtuales de práctica (VCoP), en donde sus miembros generan conocimiento en base al traspaso de experiencias sobre las mejores prácticas en relación a algún tema en particular. En general los miembros comparten sólo con algunos usuarios específicos de la red formando así sub-comunidades. Identificar y caracterizar adecuadamente estas sub-estructuras es de vital importancia, pues son en ellas donde se generan las interacciones necesarias para la creación y desarrollo del conocimiento de la comunidad. El objetivo principal de este trabajo es desarrollar e implementar una metodología para mejorar el proceso de búsqueda de sub-comunidades mediante el uso de Social Network Analysis (SNA) y Text Mining, con el fin de apoyar el proceso de administración en una VCoP. Para ello se propone una metodología que combina dos procesos Knowledge Discovery in Databases (KDD) y SNA y fue aplicada sobre una VCoP real llamada Plexilandia. En la etapa de KDD se efectuó la selección, limpieza, y transformación de los post de los usuarios, para luego aplicar estrategias de reducción de contenido basadas en Text Mining, en particular Latent Dirichlet Allocation (LDA) y Concept Based Text Mining (CB), que permiten describir cada post en términos de tópicos o conceptos. En la etapa de SNA se construyeron grafos o redes que son filtradas utilizando la información obtenida en la etapa anterior. A continuación se utilizaron algoritmos basados en la modularity y algunas mejoras desarrolladas en esta tesis de estos métodos para encontrar las sub-comunidades. Los resultados de los experimentos muestran que las redes filtradas, en general, poseen estructuras de comunidad más fuertes que las redes sin filtrar, un 5% más estables en términos de comunidades encontradas frente a diferentes algoritmos, de una composición, en promedio un 30% diferente a las comunidades encontradas en las redes sin filtrar, y que entre los miembros de las comunidades encontradas se comparte un mayor porcentaje de temas comunes, un 8% mayor para las redes sobre LDA y un 30% mayor para las redes sobre CB en comparación con los grupos encontrados sobre las redes sin filtrar, lo que permite obtener nueva y mejor información acerca de las sub-comunidades en la red. Adicionalmente el uso de estas herramientas basadas en el contenido permite caracterizar a las comunidades encontradas en función de un grupo reducido de tópicos o conceptos, tarea que con los métodos tradicionales no se puede lograr.