Robust Descriptor Learning Using Variational Auto-Encoders

Image matching is the task of finding points in one image corresponding to the same points in the other image. Classical feature descriptors fail to match points when the images are under extreme viewpoint or seasonal changes. This thesis tackles the problem of image matching when two images are und...

Full description

Bibliographic Details
Main Author:	Valavanis, Leonidas
Format:	Others
Language:	English
Published:	KTH, Skolan för elektroteknik och datavetenskap (EECS) 2020
Subjects:	Computer and Information Sciences Data- och informationsvetenskap
Online Access:	http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288725

id	ndltd-UPSALLA1-oai-DiVA.org-kth-288725
record_format	oai_dc
spelling	ndltd-UPSALLA1-oai-DiVA.org-kth-2887252021-08-03T09:28:36ZRobust Descriptor Learning Using Variational Auto-EncodersengRobust deskriptor inlärning med hjälp av Variational Auto-EncoderValavanis, LeonidasKTH, Skolan för elektroteknik och datavetenskap (EECS)2020Computer and Information SciencesData- och informationsvetenskapImage matching is the task of finding points in one image corresponding to the same points in the other image. Classical feature descriptors fail to match points when the images are under extreme viewpoint or seasonal changes. This thesis tackles the problem of image matching when two images are under severe changes. We propose two methods that use Variational Auto-Encoders (VAE). Variational Auto-Encoders are unsupervised generative models that encode images into a low dimensional space, called Latent Space. To improve the robustness of our methods, we train theVAE with a loss function that learns to discriminate between similar and dissimilar pairs of patches, called triplet loss. The first method, called FT-VAE, is a VAE trained with the triplet loss that creates more robust features towards rotation or seasonal changes. The second architecture, called VAE2Enc, is a novel architecture, trained in two steps, that encourages encoding rotation or seasonal changes in a small part of the latent space while creating more robust features. Empirical evaluation of FT-VAE demonstrates competitive results compared to the state of the art methods in patch pair classification. Bildmatchning är uppgiften att hitta punkter i en bild som motsvarar samma punkter i den andra bilden. Klassiska funktions beskrivare matchar inte punkter när bilderna är under extrema synvinklar eller säsongs förändringar. Denna avhandling tar upp problemet med bildmatchning när två bilder är under stora förändringar. Vi föreslår två metoder som använder Variation Auto-Encoders (VAE). Variations autokodare är generativa modeller som tränas med oövervakad inlärning, dessa modeller kodar bilder till ett lågt dimensionellt utrymme, kallat latent utrymme. För att förbättra robustheten i våra metoder tränar vi VAE med en förlustfunktion som lär sig att skilja mellan liknande och olika par av fläckar, kallad triplet loss. Den första metoden, kallad FT-VAE, är en VAE utbildad med trippelförlusten som skapar mer robusta funktioner mot rotation eller säsongs förändringar. Den andra arkitekturen, kallad VAE2Enc, är en ny arkitektur som tränas i två steg och som uppmuntrar kodning av rotation eller säsongs förändringar i en liten del av det latenta utrymmet samtidigt som det skapar mer robusta funktioner. Empirisk utvärdering av FT-VAE visar konkurrenskraftiga resultat jämfört med toppmoderna metoder inom klassificering av patchpar. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288725TRITA-EECS-EX ; 2020:849application/pdfinfo:eu-repo/semantics/openAccess
collection	NDLTD
language	English
format	Others
sources	NDLTD
topic	Computer and Information Sciences Data- och informationsvetenskap
spellingShingle	Computer and Information Sciences Data- och informationsvetenskap Valavanis, Leonidas Robust Descriptor Learning Using Variational Auto-Encoders
description	Image matching is the task of finding points in one image corresponding to the same points in the other image. Classical feature descriptors fail to match points when the images are under extreme viewpoint or seasonal changes. This thesis tackles the problem of image matching when two images are under severe changes. We propose two methods that use Variational Auto-Encoders (VAE). Variational Auto-Encoders are unsupervised generative models that encode images into a low dimensional space, called Latent Space. To improve the robustness of our methods, we train theVAE with a loss function that learns to discriminate between similar and dissimilar pairs of patches, called triplet loss. The first method, called FT-VAE, is a VAE trained with the triplet loss that creates more robust features towards rotation or seasonal changes. The second architecture, called VAE2Enc, is a novel architecture, trained in two steps, that encourages encoding rotation or seasonal changes in a small part of the latent space while creating more robust features. Empirical evaluation of FT-VAE demonstrates competitive results compared to the state of the art methods in patch pair classification. === Bildmatchning är uppgiften att hitta punkter i en bild som motsvarar samma punkter i den andra bilden. Klassiska funktions beskrivare matchar inte punkter när bilderna är under extrema synvinklar eller säsongs förändringar. Denna avhandling tar upp problemet med bildmatchning när två bilder är under stora förändringar. Vi föreslår två metoder som använder Variation Auto-Encoders (VAE). Variations autokodare är generativa modeller som tränas med oövervakad inlärning, dessa modeller kodar bilder till ett lågt dimensionellt utrymme, kallat latent utrymme. För att förbättra robustheten i våra metoder tränar vi VAE med en förlustfunktion som lär sig att skilja mellan liknande och olika par av fläckar, kallad triplet loss. Den första metoden, kallad FT-VAE, är en VAE utbildad med trippelförlusten som skapar mer robusta funktioner mot rotation eller säsongs förändringar. Den andra arkitekturen, kallad VAE2Enc, är en ny arkitektur som tränas i två steg och som uppmuntrar kodning av rotation eller säsongs förändringar i en liten del av det latenta utrymmet samtidigt som det skapar mer robusta funktioner. Empirisk utvärdering av FT-VAE visar konkurrenskraftiga resultat jämfört med toppmoderna metoder inom klassificering av patchpar.
author	Valavanis, Leonidas
author_facet	Valavanis, Leonidas
author_sort	Valavanis, Leonidas
title	Robust Descriptor Learning Using Variational Auto-Encoders
title_short	Robust Descriptor Learning Using Variational Auto-Encoders
title_full	Robust Descriptor Learning Using Variational Auto-Encoders
title_fullStr	Robust Descriptor Learning Using Variational Auto-Encoders
title_full_unstemmed	Robust Descriptor Learning Using Variational Auto-Encoders
title_sort	robust descriptor learning using variational auto-encoders
publisher	KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate	2020
url	http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288725
work_keys_str_mv	AT valavanisleonidas robustdescriptorlearningusingvariationalautoencoders AT valavanisleonidas robustdeskriptorinlarningmedhjalpavvariationalautoencoder
_version_	1719458657421230080

Robust Descriptor Learning Using Variational Auto-Encoders

Similar Items