Clasificación de usuarios de instagram en base a texto e imágenes |

Memoria para optar al título de Ingeniero Civil en Computación === El proyecto consiste en generar un modelo de clasificación de influenciadores. El contexto es el mercado de marketing digital en Instagram, red social basada en publicaciones de sus usuarios, donde se puede comentar las publicacion...

Full description

Bibliographic Details
Main Author: Kauer Madrid, Maximiliano Sebastián
Other Authors: Saavedra Rondo, José
Language:es
Published: Universidad de Chile 2019
Subjects:
Online Access:http://repositorio.uchile.cl/handle/2250/171132
Description
Summary:Memoria para optar al título de Ingeniero Civil en Computación === El proyecto consiste en generar un modelo de clasificación de influenciadores. El contexto es el mercado de marketing digital en Instagram, red social basada en publicaciones de sus usuarios, donde se puede comentar las publicaciones de otras personas y dar likes. Un influen- ciador es un usuario que es considerado influyente ; tiene muchos seguidores, normalmente más de 3.000, y realiza campañas publicitarias en las que promociona productos a través de su cuenta personal de Instagram. Haip es una empresa dedicada a este mercado, que busca encontrar los influenciadores más apropiados para campañas publicitarias de, por ejemplo, productos deportivos o de belleza. Actualmente, buscar influenciadores es un proceso costoso porque es, en su mayoría, manual, y requiere de un gasto considerable de tiempo. Por esto es que se busca clasificar a los influenciadores en categorías como deporte , aire libre , etc. Conocer de antemano las categorías a las que pertenece cada influenciador permitirá agilizar las operaciones de la empresa y optimizar los procesos. Para lograr el objetivo planteado, se usan modelos de aprendizaje de máquinas tales como redes neuronales, word embeddings y SVMs. Para ello se deben recolectar suficientes datos y entrenar los modelos de manera eficiente. Los datos para clasificar a los influenciadores consisten en sus publicaciones, los que incluyen una o más imágenes y un texto, sin embar- go, para entrenar los modelos es necesario primero juntar una cantidad suficiente de datos previamente etiquetados, lo que se logra buscando fuentes de imágenes de acceso público en ImageNet y Pexels. Para clasificar una publicación, se usa ResNet, primero para clasificar la imagen y segundo para producir un vector en R n a partir de la imagen, y fastText para hacer lo mismo a partir del texto. Luego se usa una red neuronal para la clasificación usando ambos vectores. Finalmente se compara la precisión de la clasificación usando solo las imágenes, solo los textos, y usando ambos. Se logra diseñar un clasificados que es muy efectivo para clasificar en 5 categorías. El clasificador se compara con un conjunto de influenciadores ya clasificados por un grupo de 2 personas, y tiene un rendimiento suficientemente alto, por lo que pasa a ser usado en la plataforma de Haip. En un trabajo futuro, se puede extender el clasificador para aumentar la cantidad de categorías.