Analysis of the effect of latent dimensions on disentanglement in Variational Autoencoders

Disentanglement is a subcategory to Representaton learning where we, apart from believing that useful properties can be extracted from the data in a more compact form, also envision that the data itself is constituted from a lower-dimensional subset of explanatory factors. Explanatory factors are an...

Full description

Bibliographic Details
Main Author: Dahl, Joakim
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2021
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-291614
Description
Summary:Disentanglement is a subcategory to Representaton learning where we, apart from believing that useful properties can be extracted from the data in a more compact form, also envision that the data itself is constituted from a lower-dimensional subset of explanatory factors. Explanatory factors are an ambiguous concept and what they portray varies with the dataset. A dataset constituted of flowers may have stem size and color as explanatory factors, while for another dataset it may be location or position. The explanatory factors are themselves often nested in a complex interaction in order to generate the data. Disentanglement can be summarized as to breaking the potentially complex interaction between the explanatory factors to liberate them from one another. The liberated explanatory factors can then constitute the foundation of the representations, a procedure that is believed to enhance downstream machine learning tasks. Disentangling the explanatory factors in an unsupervised environment has proven to be a difficult task for many reasons, perhaps most notably the lack of knowledge of how many they are and what they reflect. To be able to evaluate the degree of disentanglement attained, we will consider a dataset annotated for us with target labels corresponding to the explanatory factors that generated the data. Knowing the number of explanatory factors gives an indication of what dimensionality the representation should have to at least be able to capture all of the explanatory factors. Many of the empirical studies that have been considered in this paper treat the dimensionality of the representations as a constant when evaluating the degree of disentanglement achieved. The purpose of this paper is to extend the discussion regarding disentanglement by treating the dimensionality of the representations as a variable to be alternated and investigate how this impacts the degree of disentanglement achieved. The experiments performed in this paper do however suggest that the visual inspection of the disentanglement attained in a high dimensional representation space are difficult to interpret and evaluate for the human eye. One is therefore even further reliant on the disentanglement scores, which does not require any human interaction for the evaluation. The disentanglement scores seem to exhibit a static behaviour, not changing as much as one would believe given the visual inspection. Therefore, investigating how the representation dimensionality affect the disentanglement attained among the representations is a delicate matter. Many of the empirical studies considered in this paper suggest that mostly the regularization is impacting the disentanglement. It does however seem like there are far more parameters than originally was expected that need further evaluation to deduce their impact with respect to disentanglement.   === Utnästling är en underkategori till Representations inlärning där vi inte bara tror att nyttiga egenskaper av datan kan utvinnas i en mer kompakt form, utan också att datan själv är bestående av en lågdimensionell delmängd av förklarande faktorer. Förklarande faktorer är ett tvetydigt begrepp och vad dessa poträtterar är varierande med datasetet i fråga. Ett dataset bestående av blommor kan ha stjälk storlek och färg som förklarande faktorer, medan för ett annat dataset kan detta vara plats eller position. Dem förklarande faktorerna är ofta nästlade i en komplex interaktion för att generera datan. Utnästling kan summeras som att bryta ner denna potentiellt komplexa interaktion mellan dem förklarande faktorerna för att frigöra dem från varandra. Dem frigivna förklarande faktorerna utgör därefter själva grunden till representationerna, en procedur som är betrodd att förbättra nedströms maskininlärningsuppgifter. Att nästla ut dem förklarande faktorerna i en oövervakad omgivning har visat sig vara en svår uppgift av många anledningar, kanske den allra viktigaste är att vi saknar vetskap om hur många dem är och vad dem reflekterar. För att kunna utvärdera graden av utnästling som vi har uppnått så kommer vi att betrakta ett dataset som är annoterat med de förklarande faktorer som genererade datan. Att veta hur många de förklarande faktorerna är ger en indikation av vilken dimensionalitet representationerna bör ha för att åtminstone kunna fånga alla de förklarande faktorerna. Många av de empiriska studier som betraktats i detta papper behandlar dimensionaliteten av representationerna som en konstant när vi utvärderar utnästlingen som uppnåtts. Syftet med detta papper är att förlänga diskussionen runt utnästling genom att behandla dimensionaliteten av representationerna som en variabel att alternera och undersöka hur detta påverkar graden av utnästling som uppnåtts.   Experimenten som utförts i detta papper indikerar att visuell inspektion av den uppnådda utnästlingen i ett högdimensionellt representationsrum är svårt att tolka och utvärdera för ett mänskligt öga. Därav är vi ofta beroende av utnästlingspoäng, som inte behöver någon mänsklig interaktion för utvärderingen. Utnästlingspoängen uppvisar dock ett statiskt beteende, och förändras inte till den grad som den visuella inspektionen indikerar. Av just denna anledning är utvärderingen av hur representations dimensionaliteten påverkar utnästlingen uppnådd hos representationerna ett känsligt ämne. Många av de empiriska studier som betraktats i detta papper föreslår att regulariseringen är det som mestadels påverkar utnästlingen. Det verkar huruvida som att där är betydligt fler parametrar än vad som tidigare misstänkts som behöver utvärderas, och i synnerhet deras påverkan på utnästlingen.