Robust Descriptor Learning Using Variational Auto-Encoders

Image matching is the task of finding points in one image corresponding to the same points in the other image. Classical feature descriptors fail to match points when the images are under extreme viewpoint or seasonal changes. This thesis tackles the problem of image matching when two images are und...

Full description

Bibliographic Details
Main Author: Valavanis, Leonidas
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2020
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288725
id ndltd-UPSALLA1-oai-DiVA.org-kth-288725
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2887252021-08-03T09:28:36ZRobust Descriptor Learning Using Variational Auto-EncodersengRobust deskriptor inlärning med hjälp av Variational Auto-EncoderValavanis, LeonidasKTH, Skolan för elektroteknik och datavetenskap (EECS)2020Computer and Information SciencesData- och informationsvetenskapImage matching is the task of finding points in one image corresponding to the same points in the other image. Classical feature descriptors fail to match points when the images are under extreme viewpoint or seasonal changes. This thesis tackles the problem of image matching when two images are under severe changes. We propose two methods that use Variational Auto-Encoders (VAE). Variational Auto-Encoders are unsupervised generative models that encode images into a low dimensional space, called Latent Space. To improve the robustness of our methods, we train theVAE with a loss function that learns to discriminate between similar and dissimilar pairs of patches, called triplet loss. The first method, called FT-VAE, is a VAE trained with the triplet loss that creates more robust features towards rotation or seasonal changes. The second architecture, called VAE2Enc, is a novel architecture, trained in two steps, that encourages encoding rotation or seasonal changes in a small part of the latent space while creating more robust features. Empirical evaluation of FT-VAE demonstrates competitive results compared to the state of the art methods in patch pair classification.  Bildmatchning är uppgiften att hitta punkter i en bild som motsvarar samma punkter i den andra bilden. Klassiska funktions beskrivare matchar inte punkter när bilderna är under extrema synvinklar eller säsongs förändringar. Denna avhandling tar upp problemet med bildmatchning när två bilder är under stora förändringar. Vi föreslår två metoder som använder Variation Auto-Encoders (VAE). Variations autokodare är generativa modeller som tränas med oövervakad inlärning, dessa modeller kodar bilder till ett lågt dimensionellt utrymme, kallat latent utrymme. För att förbättra robustheten i våra metoder tränar vi VAE med en förlustfunktion som lär sig att skilja mellan liknande och olika par av fläckar, kallad triplet loss. Den första metoden, kallad FT-VAE, är en VAE utbildad med trippelförlusten som skapar mer robusta funktioner mot rotation eller säsongs förändringar. Den andra arkitekturen, kallad VAE2Enc, är en ny arkitektur som tränas i två steg och som uppmuntrar kodning av rotation eller säsongs förändringar i en liten del av det latenta utrymmet samtidigt som det skapar mer robusta funktioner. Empirisk utvärdering av FT-VAE visar konkurrenskraftiga resultat jämfört med toppmoderna metoder inom klassificering av patchpar. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288725TRITA-EECS-EX ; 2020:849application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Computer and Information Sciences
Data- och informationsvetenskap
spellingShingle Computer and Information Sciences
Data- och informationsvetenskap
Valavanis, Leonidas
Robust Descriptor Learning Using Variational Auto-Encoders
description Image matching is the task of finding points in one image corresponding to the same points in the other image. Classical feature descriptors fail to match points when the images are under extreme viewpoint or seasonal changes. This thesis tackles the problem of image matching when two images are under severe changes. We propose two methods that use Variational Auto-Encoders (VAE). Variational Auto-Encoders are unsupervised generative models that encode images into a low dimensional space, called Latent Space. To improve the robustness of our methods, we train theVAE with a loss function that learns to discriminate between similar and dissimilar pairs of patches, called triplet loss. The first method, called FT-VAE, is a VAE trained with the triplet loss that creates more robust features towards rotation or seasonal changes. The second architecture, called VAE2Enc, is a novel architecture, trained in two steps, that encourages encoding rotation or seasonal changes in a small part of the latent space while creating more robust features. Empirical evaluation of FT-VAE demonstrates competitive results compared to the state of the art methods in patch pair classification.  === Bildmatchning är uppgiften att hitta punkter i en bild som motsvarar samma punkter i den andra bilden. Klassiska funktions beskrivare matchar inte punkter när bilderna är under extrema synvinklar eller säsongs förändringar. Denna avhandling tar upp problemet med bildmatchning när två bilder är under stora förändringar. Vi föreslår två metoder som använder Variation Auto-Encoders (VAE). Variations autokodare är generativa modeller som tränas med oövervakad inlärning, dessa modeller kodar bilder till ett lågt dimensionellt utrymme, kallat latent utrymme. För att förbättra robustheten i våra metoder tränar vi VAE med en förlustfunktion som lär sig att skilja mellan liknande och olika par av fläckar, kallad triplet loss. Den första metoden, kallad FT-VAE, är en VAE utbildad med trippelförlusten som skapar mer robusta funktioner mot rotation eller säsongs förändringar. Den andra arkitekturen, kallad VAE2Enc, är en ny arkitektur som tränas i två steg och som uppmuntrar kodning av rotation eller säsongs förändringar i en liten del av det latenta utrymmet samtidigt som det skapar mer robusta funktioner. Empirisk utvärdering av FT-VAE visar konkurrenskraftiga resultat jämfört med toppmoderna metoder inom klassificering av patchpar.
author Valavanis, Leonidas
author_facet Valavanis, Leonidas
author_sort Valavanis, Leonidas
title Robust Descriptor Learning Using Variational Auto-Encoders
title_short Robust Descriptor Learning Using Variational Auto-Encoders
title_full Robust Descriptor Learning Using Variational Auto-Encoders
title_fullStr Robust Descriptor Learning Using Variational Auto-Encoders
title_full_unstemmed Robust Descriptor Learning Using Variational Auto-Encoders
title_sort robust descriptor learning using variational auto-encoders
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2020
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288725
work_keys_str_mv AT valavanisleonidas robustdescriptorlearningusingvariationalautoencoders
AT valavanisleonidas robustdeskriptorinlarningmedhjalpavvariationalautoencoder
_version_ 1719458657421230080