Ομαδοποίηση δεδομένων και εφαρμογές

Στην παρούσα διπλωματική εργασία γίνεται αναλυτική παρουσίαση των μεθόδων ομαδοποίησης, καθώς και της Ανάλυσης Κύριων Συνιστωσών (ΑΚΣ). Σκοπός είναι να μελετηθεί η αποτελεσματικότητα της χρήσης, της Ανάλυσης Κύριων Συνιστωσών σε σύνολα δεδομένων προς ομαδοποίηση. Πιο συγκεκριμένα, συγκρίνονται εμπει...

Full description

Bibliographic Details
Main Author: Σαρρής, Γιώργος
Other Authors: Βραχάτης, Μιχαήλ
Language:gr
Published: 2013
Subjects:
Online Access:http://hdl.handle.net/10889/6498
Description
Summary:Στην παρούσα διπλωματική εργασία γίνεται αναλυτική παρουσίαση των μεθόδων ομαδοποίησης, καθώς και της Ανάλυσης Κύριων Συνιστωσών (ΑΚΣ). Σκοπός είναι να μελετηθεί η αποτελεσματικότητα της χρήσης, της Ανάλυσης Κύριων Συνιστωσών σε σύνολα δεδομένων προς ομαδοποίηση. Πιο συγκεκριμένα, συγκρίνονται εμπειρικά τα πειραματικά αποτελέσματα που παράχθηκαν από την ομαδοποίηση συνόλων δεδομένων πριν και μετά τη χρήση της ΑΚΣ σε τεχνητά και πραγματικά σύνολα δεδομένων. Στο πρώτο κεφάλαιο πραγματοποιείται μία παρουσίαση των κύριων εννοιών που άπτονται της ομαδοποίησης δεδομένων, καθώς και παρουσιάζονται οι πιο γνωστές τεχνικές ομαδοποίησης. Στο δεύτερο κεφάλαιο παρουσιάζεται συνοπτικά η Ανάλυση Κύριων Συνιστωσών, καθώς και παραθέτονται διάφορα κριτήρια επιλογής του πλήθους των κύριων συνιστωσών. Η εργασία τελειώνει με την παρουσίαση πειραματικών αποτελεσμάτων ομαδοποίησης σε τεχνητά και πραγματικά σύνολα δεδομένων, πριν και μετά τη χρήση της ΑΚΣ με διαφορετικές τεχνικές ομαδοποίησης. === In the thesis at hand, several clustering methods along with the Principal Component Analysis (PCA) are presented. The main goal is to study the application of PCA on data sets for clustering purposes. More specifically, several clustering algorithms are compared through experimental simulations and results on data sets before and after the use of PCA respectively. For this purpose simulated and real case data are employed. The first chapter of the thesis is devoted to the analytical definition of clustering and the presentation of several clustering techniques. In the second chapter, the PCA method is presented along with an extended study on criteria for determining the number of principal directions. Finally, the thesis ends with extensive experimental results, discussion and concluding remarks.