Multivariate Dichteschätzung in der explorativen Datenanalyse
Multivariate density estimation in exploratory data analysis
- In der statistischen Datenanalyse wird üblicherweise angenommen, dass die empirischen Daten einer Wahrscheinlichkeitsverteilung unterliegen. Das Ziel der Dichteschätzung in der explorativen Datenanalyse besteht darin, die unbekannte Dichtefunktion anhand der vorhandenen empirischen Beobachtungen mittels statistischen Verfahren zu schätzen und die in den Daten versteckte nützliche Information im Betracht der geschätzten Dichte zu extrahieren. Heutzutage spielt nichtparametrische Dichteschätzung in der explorativen Datenanalyse mit der Entwicklung der Computertechnik eine immer wichtigere Rolle, während parametrische Dichteschätzung stark von der Modellannahme abhängt und in der Praxis oft wegen des Mangels der a priori Information nicht einwandfrei einsetzbar ist. Die vorliegende Arbeit konzentriert sich auf eine in der Praxis oft eingesetzte Familie der nichtparametrischen Dichteschätzung, nämlich die Kerndichteschätzung. Ziel dieser Arbeit ist es, zu untersuchen, wie die unbekannteIn der statistischen Datenanalyse wird üblicherweise angenommen, dass die empirischen Daten einer Wahrscheinlichkeitsverteilung unterliegen. Das Ziel der Dichteschätzung in der explorativen Datenanalyse besteht darin, die unbekannte Dichtefunktion anhand der vorhandenen empirischen Beobachtungen mittels statistischen Verfahren zu schätzen und die in den Daten versteckte nützliche Information im Betracht der geschätzten Dichte zu extrahieren. Heutzutage spielt nichtparametrische Dichteschätzung in der explorativen Datenanalyse mit der Entwicklung der Computertechnik eine immer wichtigere Rolle, während parametrische Dichteschätzung stark von der Modellannahme abhängt und in der Praxis oft wegen des Mangels der a priori Information nicht einwandfrei einsetzbar ist. Die vorliegende Arbeit konzentriert sich auf eine in der Praxis oft eingesetzte Familie der nichtparametrischen Dichteschätzung, nämlich die Kerndichteschätzung. Ziel dieser Arbeit ist es, zu untersuchen, wie die unbekannte Modalstruktur der Daten durch den Einsatz nichtparametrischer Dichteschätzungsmethoden und geeigneter Visualisierungstechniken aufzudecken ist. In dieser Arbeit wird angenommen, dass die Daten einer gewissen Wahrscheinlichkeitsverteilung mit Dichtefunktion f unterliegen und zu den Domänen der Modi in f gehören.…
- In statistical data analysis is commonly assumed that the empirical data may be regarded as a sample from some underlying density in feature space. The goal of density estimation in exploratory data analysis is to estimate the unknown density function based on empirical observations using statistical approaches in order to understand important features hidden in the data. Today, nonparametric density estimation plays in the exploratory data analysis with development of computer technology an important role, whereas parametric methods are not applicable, if little a priori information is known. The present work focuses on kernel density estimation, one of the most popular used nonparametric density estimators. The aim of this work is to investigate how to undercover the unknown modal structure using nonparametric density estimators and appropriate visualization techniques. In this paper it is assumed that the data are from some underlying density function f and can be assigned toIn statistical data analysis is commonly assumed that the empirical data may be regarded as a sample from some underlying density in feature space. The goal of density estimation in exploratory data analysis is to estimate the unknown density function based on empirical observations using statistical approaches in order to understand important features hidden in the data. Today, nonparametric density estimation plays in the exploratory data analysis with development of computer technology an important role, whereas parametric methods are not applicable, if little a priori information is known. The present work focuses on kernel density estimation, one of the most popular used nonparametric density estimators. The aim of this work is to investigate how to undercover the unknown modal structure using nonparametric density estimators and appropriate visualization techniques. In this paper it is assumed that the data are from some underlying density function f and can be assigned to domains of attractions of the modes in f.…
Author: | Hao Wang |
---|---|
URN: | urn:nbn:de:bvb:384-opus-15241 |
Frontdoor URL | https://opus.bibliothek.uni-augsburg.de/opus4/1383 |
Advisor: | Antony R. Unwin |
Type: | Doctoral Thesis |
Language: | German |
Publishing Institution: | Universität Augsburg |
Granting Institution: | Universität Augsburg, Mathematisch-Naturwissenschaftlich-Technische Fakultät |
Date of final exam: | 2010/01/27 |
Release Date: | 2010/04/20 |
Tag: | Modalstruktur density estimation; clustering; mode; visualization; R |
GND-Keyword: | Dichteschätzung; Dichtebasiertes Clusterverfahren; Visualisierung |
Institutes: | Mathematisch-Naturwissenschaftlich-Technische Fakultät |
Mathematisch-Naturwissenschaftlich-Technische Fakultät / Institut für Mathematik | |
Dewey Decimal Classification: | 3 Sozialwissenschaften / 31 Statistiken / 310 Sammlungen allgemeiner Statistiken |
Licence (German): | ![]() |