Clustering‐based decision tree classifier construction / Klasterių sprendimų medžiu pagrįstas statybos klasifikatorius

This article studies data structure investigation possibilities using cluster analysis. Density structures within classes are explored to implement class decomposition in order to enhance performance of decision tree classifiers. Classes are decomposed using cluster analysis and cluster merge evalu...

Full description

Bibliographic Details
Main Authors: Inese Polaka, Arkady Borisov
Format: Article
Language:English
Published: Vilnius Gediminas Technical University 2010-12-01
Series:Technological and Economic Development of Economy
Subjects:
Online Access:https://journals.vgtu.lt/index.php/TEDE/article/view/5919
Description
Summary:This article studies data structure investigation possibilities using cluster analysis. Density structures within classes are explored to implement class decomposition in order to enhance performance of decision tree classifiers. Classes are decomposed using cluster analysis and cluster merge evaluation using decision tree classifiers. Then impact of class decomposition is shown on C4.5 and CART classifiers. The main focus is on experiments carried out with real‐valued data sets. The experiments are described in a step‐by‐step manner to illustrate the patterns discovered which affect previously proposed patterns in class decomposition methodology. Santrauka Straipsnyje nagrinėjamos duomenų struktūros tyrimo galimybės naudojant klasterinė analizė. Tiriamos įvairaus tankio klasės ir siekiama tokio klasės išskaidymo laipsnio, kad padidetų sprendimų medžio klasifikatorių veiksmingumas. Klasės suskaidomos klasterinės analizės ir klasterių sujungimo metodais, naudojant sprendimų medžio klasifikatorius. Tada klasės skilimo poveikis parodomas C4.5 ir CART klasifikatoriuose. Pagrindinis dėmesys skiriamas bandymams, atliktiems su realiu duomenų rinkiniais. Eksperimentai aprašomi žingsnis po žingsnio, iliustruojant atrastus modelius, kurie veikia anksčiau siūlytus klasių modelius. First published online: 10 Feb 2011 Reikšminiai žodžiai: klasifikacija, klasės skilimas, klasterinė analizė, sprendimų medžiai, duomenų generavimas
ISSN:2029-4913
2029-4921