Clasificación de usuarios de instagram en base a texto e imágenes |
Memoria para optar al título de Ingeniero Civil en Computación === El proyecto consiste en generar un modelo de clasificación de influenciadores. El contexto es el mercado de marketing digital en Instagram, red social basada en publicaciones de sus usuarios, donde se puede comentar las publicacion...
Main Author: | |
---|---|
Other Authors: | |
Language: | es |
Published: |
Universidad de Chile
2019
|
Subjects: | |
Online Access: | http://repositorio.uchile.cl/handle/2250/171132 |
id |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-171132 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1711322019-11-30T21:18:03Z Clasificación de usuarios de instagram en base a texto e imágenes | Kauer Madrid, Maximiliano Sebastián Saavedra Rondo, José Poblete Labra, Barbara Barrios Nuñez, Juan Aprendizaje de máquina Redes neuronales (Ciencia de la computación) Comercialización - Chile - Innovaciones tecnológicas. Redes sociales Memoria para optar al título de Ingeniero Civil en Computación El proyecto consiste en generar un modelo de clasificación de influenciadores. El contexto es el mercado de marketing digital en Instagram, red social basada en publicaciones de sus usuarios, donde se puede comentar las publicaciones de otras personas y dar likes. Un influen- ciador es un usuario que es considerado influyente ; tiene muchos seguidores, normalmente más de 3.000, y realiza campañas publicitarias en las que promociona productos a través de su cuenta personal de Instagram. Haip es una empresa dedicada a este mercado, que busca encontrar los influenciadores más apropiados para campañas publicitarias de, por ejemplo, productos deportivos o de belleza. Actualmente, buscar influenciadores es un proceso costoso porque es, en su mayoría, manual, y requiere de un gasto considerable de tiempo. Por esto es que se busca clasificar a los influenciadores en categorías como deporte , aire libre , etc. Conocer de antemano las categorías a las que pertenece cada influenciador permitirá agilizar las operaciones de la empresa y optimizar los procesos. Para lograr el objetivo planteado, se usan modelos de aprendizaje de máquinas tales como redes neuronales, word embeddings y SVMs. Para ello se deben recolectar suficientes datos y entrenar los modelos de manera eficiente. Los datos para clasificar a los influenciadores consisten en sus publicaciones, los que incluyen una o más imágenes y un texto, sin embar- go, para entrenar los modelos es necesario primero juntar una cantidad suficiente de datos previamente etiquetados, lo que se logra buscando fuentes de imágenes de acceso público en ImageNet y Pexels. Para clasificar una publicación, se usa ResNet, primero para clasificar la imagen y segundo para producir un vector en R n a partir de la imagen, y fastText para hacer lo mismo a partir del texto. Luego se usa una red neuronal para la clasificación usando ambos vectores. Finalmente se compara la precisión de la clasificación usando solo las imágenes, solo los textos, y usando ambos. Se logra diseñar un clasificados que es muy efectivo para clasificar en 5 categorías. El clasificador se compara con un conjunto de influenciadores ya clasificados por un grupo de 2 personas, y tiene un rendimiento suficientemente alto, por lo que pasa a ser usado en la plataforma de Haip. En un trabajo futuro, se puede extender el clasificador para aumentar la cantidad de categorías. 2019-10-10T20:17:46Z 2019-10-10T20:17:46Z 2019 Tesis http://repositorio.uchile.cl/handle/2250/171132 es Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile |
collection |
NDLTD |
language |
es |
sources |
NDLTD |
topic |
Aprendizaje de máquina Redes neuronales (Ciencia de la computación) Comercialización - Chile - Innovaciones tecnológicas. Redes sociales |
spellingShingle |
Aprendizaje de máquina Redes neuronales (Ciencia de la computación) Comercialización - Chile - Innovaciones tecnológicas. Redes sociales Kauer Madrid, Maximiliano Sebastián Clasificación de usuarios de instagram en base a texto e imágenes | |
description |
Memoria para optar al título de Ingeniero Civil en Computación === El proyecto consiste en generar un modelo de clasificación de influenciadores. El contexto
es el mercado de marketing digital en Instagram, red social basada en publicaciones de sus
usuarios, donde se puede comentar las publicaciones de otras personas y dar likes. Un influen-
ciador es un usuario que es considerado influyente ; tiene muchos seguidores, normalmente
más de 3.000, y realiza campañas publicitarias en las que promociona productos a través de
su cuenta personal de Instagram.
Haip es una empresa dedicada a este mercado, que busca encontrar los influenciadores
más apropiados para campañas publicitarias de, por ejemplo, productos deportivos o de
belleza. Actualmente, buscar influenciadores es un proceso costoso porque es, en su mayoría,
manual, y requiere de un gasto considerable de tiempo. Por esto es que se busca clasificar
a los influenciadores en categorías como deporte , aire libre , etc. Conocer de antemano
las categorías a las que pertenece cada influenciador permitirá agilizar las operaciones de la
empresa y optimizar los procesos.
Para lograr el objetivo planteado, se usan modelos de aprendizaje de máquinas tales como
redes neuronales, word embeddings y SVMs. Para ello se deben recolectar suficientes datos
y entrenar los modelos de manera eficiente. Los datos para clasificar a los influenciadores
consisten en sus publicaciones, los que incluyen una o más imágenes y un texto, sin embar-
go, para entrenar los modelos es necesario primero juntar una cantidad suficiente de datos
previamente etiquetados, lo que se logra buscando fuentes de imágenes de acceso público en
ImageNet y Pexels. Para clasificar una publicación, se usa ResNet, primero para clasificar la
imagen y segundo para producir un vector en R n a partir de la imagen, y fastText para hacer
lo mismo a partir del texto. Luego se usa una red neuronal para la clasificación usando ambos
vectores. Finalmente se compara la precisión de la clasificación usando solo las imágenes, solo
los textos, y usando ambos.
Se logra diseñar un clasificados que es muy efectivo para clasificar en 5 categorías. El
clasificador se compara con un conjunto de influenciadores ya clasificados por un grupo de
2 personas, y tiene un rendimiento suficientemente alto, por lo que pasa a ser usado en la
plataforma de Haip. En un trabajo futuro, se puede extender el clasificador para aumentar
la cantidad de categorías. |
author2 |
Saavedra Rondo, José |
author_facet |
Saavedra Rondo, José Kauer Madrid, Maximiliano Sebastián |
author |
Kauer Madrid, Maximiliano Sebastián |
author_sort |
Kauer Madrid, Maximiliano Sebastián |
title |
Clasificación de usuarios de instagram en base a texto e imágenes | |
title_short |
Clasificación de usuarios de instagram en base a texto e imágenes | |
title_full |
Clasificación de usuarios de instagram en base a texto e imágenes | |
title_fullStr |
Clasificación de usuarios de instagram en base a texto e imágenes | |
title_full_unstemmed |
Clasificación de usuarios de instagram en base a texto e imágenes | |
title_sort |
clasificación de usuarios de instagram en base a texto e imágenes | |
publisher |
Universidad de Chile |
publishDate |
2019 |
url |
http://repositorio.uchile.cl/handle/2250/171132 |
work_keys_str_mv |
AT kauermadridmaximilianosebastian clasificaciondeusuariosdeinstagramenbaseatextoeimagenes |
_version_ |
1719301136034299904 |