Inductive learning of tree-based regression models

Dissertação de Doutoramento em Ciência de Computadores apresentada à Faculdade de Ciências da Universidade do Porto === Esta tese explora diferentes aspectos da metodologia de indução de árvores de regressão a partir de amostras de dados. O objectivo principal deste estudo é o de melhorar a capacida...

Full description

Bibliographic Details
Main Author: Torgo, Luís Fernando Raínho Alves
Format: Others
Language:Portuguese
Published: Universidade do Porto. Reitoria 2009
Online Access:http://hdl.handle.net/10216/10018
id ndltd-up.pt-oai-repositorio-aberto.up.pt-10216-10018
record_format oai_dc
spelling ndltd-up.pt-oai-repositorio-aberto.up.pt-10216-100182019-05-16T02:39:48Z Inductive learning of tree-based regression models Torgo, Luís Fernando Raínho Alves Dissertação de Doutoramento em Ciência de Computadores apresentada à Faculdade de Ciências da Universidade do Porto Esta tese explora diferentes aspectos da metodologia de indução de árvores de regressão a partir de amostras de dados. O objectivo principal deste estudo é o de melhorar a capacidade predictiva das árvores de regressão tentando manter, tanto quanto possível, a sua compreensibilidade e eficiência computacional. O nosso estudo sobre este tipo de modelos de regressão é dividido em três partes principais.Na primeira parte do estudo são descritas em detalhe duas metodologias para crescer árvores de regressão: uma que minimiza o erro quadrado médio; e outra que minimiza o desvio absoluto médio. A análise que é apresentada concentra-se primordialmente na questão da eficiência computacional do processo de crescimento das árvores. São apresentados diversos algoritmos novos que originam ganhos de eficiência computacional significativos. Por fim, é apresentada uma comparação experimental das duas metodologias alternativas, mostrando claramente os diferentes objectivos práticos de cada uma. A poda das árvores de regressão é um procedimento "standard" neste tipo de metodologias cujo objectivo principal é o de proporcionar um melhor compromisso entre a simplicidade e compreensibilidade das árvores e a sua capacidade predictiva. Na segunda parte desta dissertação são descritas uma série de técnicas novas de poda baseadas num processo de selecção a partir de um conjunto de árvores podadas alternativas. Apresentamos também um conjunto extenso de experiências comparando diferentes métodos de podar árvores de regressão. Os resultados desta comparação, levada a cabo num largo conjunto de problemas, mostram que as nossas técnicas de poda obtêm resultados, em termos de capacidade predictiva, significativamente superiores aos obtidos pelos métodos do actual "estado da arte". Na parte final desta dissertação é apresentado um novo tipo de árvores, que denominamos árvores de regressão locais. Estes modelos híbridos resultam da integração das árvores de regressão com técnicas de modelação ... 2009-05-15T12:00:27Z 2012-06-26T17:50:57Z 2009-05-15T12:00:27Z 2012-06-26T17:50:57Z 1999 Tese 2348_TD http://hdl.handle.net/10216/10018 por openAccess application/pdf application/pdf application/pdf Porto Universidade do Porto. Reitoria
collection NDLTD
language Portuguese
format Others
sources NDLTD
description Dissertação de Doutoramento em Ciência de Computadores apresentada à Faculdade de Ciências da Universidade do Porto === Esta tese explora diferentes aspectos da metodologia de indução de árvores de regressão a partir de amostras de dados. O objectivo principal deste estudo é o de melhorar a capacidade predictiva das árvores de regressão tentando manter, tanto quanto possível, a sua compreensibilidade e eficiência computacional. O nosso estudo sobre este tipo de modelos de regressão é dividido em três partes principais.Na primeira parte do estudo são descritas em detalhe duas metodologias para crescer árvores de regressão: uma que minimiza o erro quadrado médio; e outra que minimiza o desvio absoluto médio. A análise que é apresentada concentra-se primordialmente na questão da eficiência computacional do processo de crescimento das árvores. São apresentados diversos algoritmos novos que originam ganhos de eficiência computacional significativos. Por fim, é apresentada uma comparação experimental das duas metodologias alternativas, mostrando claramente os diferentes objectivos práticos de cada uma. A poda das árvores de regressão é um procedimento "standard" neste tipo de metodologias cujo objectivo principal é o de proporcionar um melhor compromisso entre a simplicidade e compreensibilidade das árvores e a sua capacidade predictiva. Na segunda parte desta dissertação são descritas uma série de técnicas novas de poda baseadas num processo de selecção a partir de um conjunto de árvores podadas alternativas. Apresentamos também um conjunto extenso de experiências comparando diferentes métodos de podar árvores de regressão. Os resultados desta comparação, levada a cabo num largo conjunto de problemas, mostram que as nossas técnicas de poda obtêm resultados, em termos de capacidade predictiva, significativamente superiores aos obtidos pelos métodos do actual "estado da arte". Na parte final desta dissertação é apresentado um novo tipo de árvores, que denominamos árvores de regressão locais. Estes modelos híbridos resultam da integração das árvores de regressão com técnicas de modelação ...
author Torgo, Luís Fernando Raínho Alves
spellingShingle Torgo, Luís Fernando Raínho Alves
Inductive learning of tree-based regression models
author_facet Torgo, Luís Fernando Raínho Alves
author_sort Torgo, Luís Fernando Raínho Alves
title Inductive learning of tree-based regression models
title_short Inductive learning of tree-based regression models
title_full Inductive learning of tree-based regression models
title_fullStr Inductive learning of tree-based regression models
title_full_unstemmed Inductive learning of tree-based regression models
title_sort inductive learning of tree-based regression models
publisher Universidade do Porto. Reitoria
publishDate 2009
url http://hdl.handle.net/10216/10018
work_keys_str_mv AT torgoluisfernandorainhoalves inductivelearningoftreebasedregressionmodels
_version_ 1719180618348101632