Multivariate Dichteschätzung in der explorativen Datenanalyse

Multivariate density estimation in exploratory data analysis

  • In der statistischen Datenanalyse wird üblicherweise angenommen, dass die empirischen Daten einer Wahrscheinlichkeitsverteilung unterliegen. Das Ziel der Dichteschätzung in der explorativen Datenanalyse besteht darin, die unbekannte Dichtefunktion anhand der vorhandenen empirischen Beobachtungen mittels statistischen Verfahren zu schätzen und die in den Daten versteckte nützliche Information im Betracht der geschätzten Dichte zu extrahieren. Heutzutage spielt nichtparametrische Dichteschätzung in der explorativen Datenanalyse mit der Entwicklung der Computertechnik eine immer wichtigere Rolle, während parametrische Dichteschätzung stark von der Modellannahme abhängt und in der Praxis oft wegen des Mangels der a priori Information nicht einwandfrei einsetzbar ist. Die vorliegende Arbeit konzentriert sich auf eine in der Praxis oft eingesetzte Familie der nichtparametrischen Dichteschätzung, nämlich die Kerndichteschätzung. Ziel dieser Arbeit ist es, zu untersuchen, wie die unbekannteIn der statistischen Datenanalyse wird üblicherweise angenommen, dass die empirischen Daten einer Wahrscheinlichkeitsverteilung unterliegen. Das Ziel der Dichteschätzung in der explorativen Datenanalyse besteht darin, die unbekannte Dichtefunktion anhand der vorhandenen empirischen Beobachtungen mittels statistischen Verfahren zu schätzen und die in den Daten versteckte nützliche Information im Betracht der geschätzten Dichte zu extrahieren. Heutzutage spielt nichtparametrische Dichteschätzung in der explorativen Datenanalyse mit der Entwicklung der Computertechnik eine immer wichtigere Rolle, während parametrische Dichteschätzung stark von der Modellannahme abhängt und in der Praxis oft wegen des Mangels der a priori Information nicht einwandfrei einsetzbar ist. Die vorliegende Arbeit konzentriert sich auf eine in der Praxis oft eingesetzte Familie der nichtparametrischen Dichteschätzung, nämlich die Kerndichteschätzung. Ziel dieser Arbeit ist es, zu untersuchen, wie die unbekannte Modalstruktur der Daten durch den Einsatz nichtparametrischer Dichteschätzungsmethoden und geeigneter Visualisierungstechniken aufzudecken ist. In dieser Arbeit wird angenommen, dass die Daten einer gewissen Wahrscheinlichkeitsverteilung mit Dichtefunktion f unterliegen und zu den Domänen der Modi in f gehören.show moreshow less
  • In statistical data analysis is commonly assumed that the empirical data may be regarded as a sample from some underlying density in feature space. The goal of density estimation in exploratory data analysis is to estimate the unknown density function based on empirical observations using statistical approaches in order to understand important features hidden in the data. Today, nonparametric density estimation plays in the exploratory data analysis with development of computer technology an important role, whereas parametric methods are not applicable, if little a priori information is known. The present work focuses on kernel density estimation, one of the most popular used nonparametric density estimators. The aim of this work is to investigate how to undercover the unknown modal structure using nonparametric density estimators and appropriate visualization techniques. In this paper it is assumed that the data are from some underlying density function f and can be assigned toIn statistical data analysis is commonly assumed that the empirical data may be regarded as a sample from some underlying density in feature space. The goal of density estimation in exploratory data analysis is to estimate the unknown density function based on empirical observations using statistical approaches in order to understand important features hidden in the data. Today, nonparametric density estimation plays in the exploratory data analysis with development of computer technology an important role, whereas parametric methods are not applicable, if little a priori information is known. The present work focuses on kernel density estimation, one of the most popular used nonparametric density estimators. The aim of this work is to investigate how to undercover the unknown modal structure using nonparametric density estimators and appropriate visualization techniques. In this paper it is assumed that the data are from some underlying density function f and can be assigned to domains of attractions of the modes in f.show moreshow less

Download full text files

Export metadata

Statistics

Number of document requests

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Hao Wang
URN:urn:nbn:de:bvb:384-opus-15241
Frontdoor URLhttps://opus.bibliothek.uni-augsburg.de/opus4/1383
Advisor:Antony R. Unwin
Type:Doctoral Thesis
Language:German
Publishing Institution:Universität Augsburg
Granting Institution:Universität Augsburg, Mathematisch-Naturwissenschaftlich-Technische Fakultät
Date of final exam:2010/01/27
Release Date:2010/04/20
Tag:Modalstruktur
density estimation; clustering; mode; visualization; R
GND-Keyword:Dichteschätzung; Dichtebasiertes Clusterverfahren; Visualisierung
Institutes:Mathematisch-Naturwissenschaftlich-Technische Fakultät
Mathematisch-Naturwissenschaftlich-Technische Fakultät / Institut für Mathematik
Dewey Decimal Classification:3 Sozialwissenschaften / 31 Statistiken / 310 Sammlungen allgemeiner Statistiken
Licence (German):Deutsches Urheberrecht