Statistische Eigenschaften von Clusterverfahren
Die vorliegende Diplomarbeit beschäftigt sich mit zwei Aspekten der statistischen Eigenschaften von Clusterverfahren. Zum einen geht die Arbeit auf die Frage der Existenz von unterschiedlichen Clusteranalysemethoden zur Strukturfindung und deren unterschiedlichen Vorgehensweisen ein. Die Methode des...
Main Author: | |
---|---|
Format: | Dissertation |
Language: | German |
Published: |
Universität Potsdam
2008
|
Subjects: | |
Online Access: | http://nbn-resolving.de/urn:nbn:de:kobv:517-opus-29026 http://opus.kobv.de/ubp/volltexte/2009/2902/ |
id |
ndltd-Potsdam-oai-kobv.de-opus-ubp-2902 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-Potsdam-oai-kobv.de-opus-ubp-29022013-01-08T00:54:44Z Statistische Eigenschaften von Clusterverfahren Statistical properties of cluster procedures Schorsch, Andrea Clusteranalyse K-Means Verfahren asymptotische Normalverteilung cluster analysis k-means clustering asymptotical normal distribution Mathematics Die vorliegende Diplomarbeit beschäftigt sich mit zwei Aspekten der statistischen Eigenschaften von Clusterverfahren. Zum einen geht die Arbeit auf die Frage der Existenz von unterschiedlichen Clusteranalysemethoden zur Strukturfindung und deren unterschiedlichen Vorgehensweisen ein. Die Methode des Abstandes zwischen Mannigfaltigkeiten und die K-means Methode liefern ausgehend von gleichen Daten unterschiedliche Endclusterungen. Der zweite Teil dieser Arbeit beschäftigt sich näher mit den asymptotischen Eigenschaften des K-means Verfahrens. Hierbei ist die Menge der optimalen Clusterzentren konsistent. Bei Vergrößerung des Stichprobenumfangs gegen Unendlich konvergiert diese in Wahrscheinlichkeit gegen die Menge der Clusterzentren, die das Varianzkriterium minimiert. Ebenfalls konvergiert die Menge der optimalen Clusterzentren für n gegen Unendlich gegen eine Normalverteilung. Es hat sich dabei ergeben, dass die einzelnen Clusterzentren voneinander abhängen. The following thesis describes two different views onto the statistical characterics of clustering procedures. At first it adresses the questions whether different clustering methods exist to ascertain the structure of clusters and in what ays the strategies of these methods differ from each other. The method of distance between the manifolds as well as the k-means method provide different final clusters based on equal initial data. The second part of the thesis concentrates on asymptotic properties of the k-means procedure. Here the amount of optimal clustering centres is consistent. If the size of the sample range is enlarged towards infinity, it also converges in probability towards the amount of clustering centres which minimized the whithin cluster sum of squares. Likewise the amount of optimal clustering centres converges for infinity towards the normal distribution. The main result shows that the individual clustering centres are dependent on each other. Universität Potsdam Mathematisch-Naturwissenschaftliche Fakultät. Institut für Mathematik 2008 MastersThesis application/pdf urn:nbn:de:kobv:517-opus-29026 http://opus.kobv.de/ubp/volltexte/2009/2902/ ger http://opus.kobv.de/ubp/doku/urheberrecht.php |
collection |
NDLTD |
language |
German |
format |
Dissertation |
sources |
NDLTD |
topic |
Clusteranalyse K-Means Verfahren asymptotische Normalverteilung cluster analysis k-means clustering asymptotical normal distribution Mathematics |
spellingShingle |
Clusteranalyse K-Means Verfahren asymptotische Normalverteilung cluster analysis k-means clustering asymptotical normal distribution Mathematics Schorsch, Andrea Statistische Eigenschaften von Clusterverfahren |
description |
Die vorliegende Diplomarbeit beschäftigt sich mit zwei Aspekten der statistischen Eigenschaften von Clusterverfahren. Zum einen geht die Arbeit auf die Frage der Existenz von unterschiedlichen Clusteranalysemethoden zur Strukturfindung und deren unterschiedlichen Vorgehensweisen ein. Die Methode des Abstandes zwischen Mannigfaltigkeiten und die K-means Methode liefern ausgehend von gleichen Daten unterschiedliche Endclusterungen.
Der zweite Teil dieser Arbeit beschäftigt sich näher mit den asymptotischen
Eigenschaften des K-means Verfahrens. Hierbei ist die Menge der optimalen Clusterzentren konsistent. Bei Vergrößerung des Stichprobenumfangs gegen Unendlich konvergiert diese in Wahrscheinlichkeit gegen die Menge der Clusterzentren, die das Varianzkriterium minimiert. Ebenfalls konvergiert die Menge der optimalen Clusterzentren für n gegen Unendlich gegen eine Normalverteilung. Es hat sich dabei ergeben, dass die einzelnen Clusterzentren voneinander abhängen. === The following thesis describes two different views onto the statistical characterics of clustering procedures. At first it adresses the questions whether different clustering methods exist to ascertain the structure of clusters and in what ays the strategies of these methods differ from each other. The method of distance between the manifolds as well as the k-means method provide different final clusters based on equal initial data.
The second part of the thesis concentrates on asymptotic properties of the k-means procedure. Here the amount of optimal clustering centres is consistent. If the size of the sample range is enlarged towards infinity, it also converges in probability towards the amount of clustering centres which minimized the whithin cluster sum of squares. Likewise the amount of optimal clustering centres converges for infinity towards the normal distribution. The main result shows that the individual clustering centres are dependent on each other. |
author |
Schorsch, Andrea |
author_facet |
Schorsch, Andrea |
author_sort |
Schorsch, Andrea |
title |
Statistische Eigenschaften von Clusterverfahren |
title_short |
Statistische Eigenschaften von Clusterverfahren |
title_full |
Statistische Eigenschaften von Clusterverfahren |
title_fullStr |
Statistische Eigenschaften von Clusterverfahren |
title_full_unstemmed |
Statistische Eigenschaften von Clusterverfahren |
title_sort |
statistische eigenschaften von clusterverfahren |
publisher |
Universität Potsdam |
publishDate |
2008 |
url |
http://nbn-resolving.de/urn:nbn:de:kobv:517-opus-29026 http://opus.kobv.de/ubp/volltexte/2009/2902/ |
work_keys_str_mv |
AT schorschandrea statistischeeigenschaftenvonclusterverfahren AT schorschandrea statisticalpropertiesofclusterprocedures |
_version_ |
1716501751441391616 |