Exploring the intersections between Information Visualization and Machine Learning

With todays flood of data coming from many types of sources, Machine Learning becomes increasingly important. Though, many times the use of Machine Learning is not enough to make sense of all this data. This makes visualization a very useful tool for Machine Learning practitioners and data analysts...

Full description

Bibliographic Details
Main Author: Corrêa, Igor Bueno
Other Authors: Carvalho, André Carlos Ponce de Leon Ferreira de
Format: Others
Language:en
Published: Biblioteca Digitais de Teses e Dissertações da USP 2018
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02012019-110149/
Description
Summary:With todays flood of data coming from many types of sources, Machine Learning becomes increasingly important. Though, many times the use of Machine Learning is not enough to make sense of all this data. This makes visualization a very useful tool for Machine Learning practitioners and data analysts alike. Interactive visualization techniques can be very helpful by giving insight on the meaning of the output from classification tasks. In this work, the aim is to explore, implement and evaluate different visualization techniques with the explicit goal of directly relating these visualization to the Machine Learning process. The proposed approach is the development of visualization techniques for a posteriori analysis that combines data exploration and classification evaluation. Results include a modified version of the Radial Visualization technique, called Dual RadViz, and also the use of interactive multiclass Partial Dependence Plots as means of finding counterfactual explanations about Machine Learning classification. An account of some of the many ways Machine Learning and visualization are used together is also given. === Hoje em dia, com o enorme fluxo de dados provenientes de muitos tipos de fontes, Aprendizado de Máquina se torna cada vez mais importante. No entanto, muitas vezes o uso de Aprendizado de Máquina não é o suficiente para que seja possível enxergar o valor e o significado de todos estes dados. Isso faz com que visualização seja uma valiosa ferramenta tanto para analistas de dados quanto para aqueles que praticam tarefas relacionadas à Aprendizado de Máquina. Técnicas de visualização interativa podem ser de grande utilidade por possibilitarem insights sobre o significado do resultado de tarefas de classificação. Neste trabalho, o objetivo é explorar, implementar e avaliar diferentes técnicas de visualização, explicitamente focando em suas relações com o processo de Aprendizado de Máquina. A abordagem proposta se trata do desenvolvimento de técnicas de visualização para análise a posteriori dos resultados de tarefas de classificação, combinando avaliação da classificação e exploração visual de dados. Os resultados incluem uma versão modificada da técnica de Visualização Radial, chamada Dual RadViz, e também o uso de Gráficos de Dependência Parcial multiclasse interativos como meio de se chegar à explicações contrafatuais sobre resultados de classificação. É dado também um relato de algumas das muitas maneiras onde Aprendizado de Máquina e visualização são usados conjuntamente.