Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines

Ingeniero Civil Eléctrico === En el presente trabajo de título se desarrolla un sistema de detección de objetos (localización y clasificación), basado en redes neuronales convolucionales (CNN por su sigla en inglés) y dos métodos clásicos de machine learning como Random Forest (RF) y Support Vector...

Full description

Bibliographic Details
Main Author: Campanini García, Diego Alejandro
Other Authors: Ruiz del Solar, Javier
Language:es
Published: Universidad de Chile 2019
Subjects:
Online Access:http://repositorio.uchile.cl/handle/2250/167863
id ndltd-UCHILE-oai-repositorio.uchile.cl-2250-167863
record_format oai_dc
spelling ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1678632019-09-01T16:25:46Z Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines Campanini García, Diego Alejandro Ruiz del Solar, Javier Estévez Valencia, Pablo Tobar Henríquez, Felipe Aprendizaje de máquina Análisis de imagen Faster R-CNN Ingeniero Civil Eléctrico En el presente trabajo de título se desarrolla un sistema de detección de objetos (localización y clasificación), basado en redes neuronales convolucionales (CNN por su sigla en inglés) y dos métodos clásicos de machine learning como Random Forest (RF) y Support Vector Machines (SVMs). La idea es mejorar, con los mencionados clasificadores, el rendimiento del sistema de detección conocido como Faster R-CNN (su significado en inglés es: Regions with CNN features). El sistema Faster R-CNN, se fundamenta en el concepto de region proposal para generar muestras candidatas a ser objetos y posteriormente producir dos salidas: una con la regresión que caracteriza la localización de los objetos y otra con los puntajes de confianza asociados a los bounding boxes predichos. Ambas salidas son generadas por capas completamente conectadas. En este trabajo se interviene la salida que genera los puntajes de confianza, tal que, en este punto se conecta un clasificador (RF o SVM), para generar con estos los puntajes de salida del sistema. De esta forma se busca mejorar el rendimiento del sistema Faster R-CNN. El entrenamiento de los clasificadores se realiza con los vectores de características extraídos, desde una de las capas completamente conectadas del sistema Faster R-CNN, específicamente se prueban las tres que contempla la arquitectura, para evaluar cuál de estas permite obtener los mejores resultados. Para definir, entre otras cosas, el número de capas convolucionales a utilizar y el tamaño de los filtros presentes en las primeras capas del sistema Faster R-CNN, se emplean los modelos de redes convolucionales ZF y VGG16, estas redes son solamente de clasificación, y son las mismas ocupados originalmente. Para desarrollar los sistemas propuestos se utilizan distintas implementaciones o librerías para las cuales se dispone de su código de forma abierta. Para el detector Faster R-CNN se utiliza una implementación desarrollado en Python, para RF se comparan dos librerías: randomForest escrita en R y scikit-learn en Python. Por su parte para SVM se utiliza la librería conocida como LIBSVM escrita en C. Las principales tareas de programación consisten en desarrollar los algoritmos de etiquetado de los vectores de características extraídos desde las capas completamente conectadas; unir los clasificadores con el sistema base, para el análisis \textit{online} de las imágenes en la etapa de prueba; programar un algoritmo para el entrenamiento eficiente en tiempo y en memoria para SVM (algoritmo conocido como hard negative mining) Al evaluar los sistemas desarrollados se concluye que los mejores resultados se obtienen con la red VGG16, específicamente para el caso en que se implementa el sistema Faster R-CNN+SVM con kernel RBF (radial basis function), logrando un mean Average Precision (mAP) de 68.9%. El segundo mejor resultado se alcanza con Faster R-CNN+RF con 180 árboles y es de 67.8%. Con el sistema original Faster R-CNN se consigue un mAP de 69.3%. 2019-03-28T17:49:47Z 2019-03-28T17:49:47Z 2018 Tesis http://repositorio.uchile.cl/handle/2250/167863 es Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile
collection NDLTD
language es
sources NDLTD
topic Aprendizaje de máquina
Análisis de imagen
Faster R-CNN
spellingShingle Aprendizaje de máquina
Análisis de imagen
Faster R-CNN
Campanini García, Diego Alejandro
Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines
description Ingeniero Civil Eléctrico === En el presente trabajo de título se desarrolla un sistema de detección de objetos (localización y clasificación), basado en redes neuronales convolucionales (CNN por su sigla en inglés) y dos métodos clásicos de machine learning como Random Forest (RF) y Support Vector Machines (SVMs). La idea es mejorar, con los mencionados clasificadores, el rendimiento del sistema de detección conocido como Faster R-CNN (su significado en inglés es: Regions with CNN features). El sistema Faster R-CNN, se fundamenta en el concepto de region proposal para generar muestras candidatas a ser objetos y posteriormente producir dos salidas: una con la regresión que caracteriza la localización de los objetos y otra con los puntajes de confianza asociados a los bounding boxes predichos. Ambas salidas son generadas por capas completamente conectadas. En este trabajo se interviene la salida que genera los puntajes de confianza, tal que, en este punto se conecta un clasificador (RF o SVM), para generar con estos los puntajes de salida del sistema. De esta forma se busca mejorar el rendimiento del sistema Faster R-CNN. El entrenamiento de los clasificadores se realiza con los vectores de características extraídos, desde una de las capas completamente conectadas del sistema Faster R-CNN, específicamente se prueban las tres que contempla la arquitectura, para evaluar cuál de estas permite obtener los mejores resultados. Para definir, entre otras cosas, el número de capas convolucionales a utilizar y el tamaño de los filtros presentes en las primeras capas del sistema Faster R-CNN, se emplean los modelos de redes convolucionales ZF y VGG16, estas redes son solamente de clasificación, y son las mismas ocupados originalmente. Para desarrollar los sistemas propuestos se utilizan distintas implementaciones o librerías para las cuales se dispone de su código de forma abierta. Para el detector Faster R-CNN se utiliza una implementación desarrollado en Python, para RF se comparan dos librerías: randomForest escrita en R y scikit-learn en Python. Por su parte para SVM se utiliza la librería conocida como LIBSVM escrita en C. Las principales tareas de programación consisten en desarrollar los algoritmos de etiquetado de los vectores de características extraídos desde las capas completamente conectadas; unir los clasificadores con el sistema base, para el análisis \textit{online} de las imágenes en la etapa de prueba; programar un algoritmo para el entrenamiento eficiente en tiempo y en memoria para SVM (algoritmo conocido como hard negative mining) Al evaluar los sistemas desarrollados se concluye que los mejores resultados se obtienen con la red VGG16, específicamente para el caso en que se implementa el sistema Faster R-CNN+SVM con kernel RBF (radial basis function), logrando un mean Average Precision (mAP) de 68.9%. El segundo mejor resultado se alcanza con Faster R-CNN+RF con 180 árboles y es de 67.8%. Con el sistema original Faster R-CNN se consigue un mAP de 69.3%.
author2 Ruiz del Solar, Javier
author_facet Ruiz del Solar, Javier
Campanini García, Diego Alejandro
author Campanini García, Diego Alejandro
author_sort Campanini García, Diego Alejandro
title Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines
title_short Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines
title_full Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines
title_fullStr Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines
title_full_unstemmed Detección de objetos usando redes neuronales convolucionales junto con Random Forest y Support Vector Machines
title_sort detección de objetos usando redes neuronales convolucionales junto con random forest y support vector machines
publisher Universidad de Chile
publishDate 2019
url http://repositorio.uchile.cl/handle/2250/167863
work_keys_str_mv AT campaninigarciadiegoalejandro detecciondeobjetosusandoredesneuronalesconvolucionalesjuntoconrandomforestysupportvectormachines
_version_ 1719242092442550272