Asymptotische Struktureigenschaften des iterativen proportionalen Anpassungsverfahrens

  • Diese Dissertation analysiert das asymptotische Verhalten von zwei Varianten des iterativen proportionalen Anpassungsverfahrens (IPF-Verfahrens, iterative proportional fitting procedure), dem zweidimensionalen IPF-Verfahren und dem mehrdimensionalen IPF-Verfahren. Das zweidimensionale IPF-Verfahren verlangt als Eingabe eine nichtnegative Ausgangsmatrix sowie positive Zeilen- und Spaltenmarginalien. Davon ausgehend wird durch abwechselnde Skalierung der Zeilen und der Spalten eine Matrizenfolge errechnet, die sogenannte IPF-Folge. Drei Ansätze zur Konvergenzanalyse werden diskutiert. Der erste Ansatz basiert auf der Informationsdivergenz, der zweite auf einem invertierten geometrischen Mittel und der dritte auf einem L1-Fehlerfunktional. Mithilfe des informationstheoretischen Ansatzes werden notwendige und hinreichende Bedingungen für die Konvergenz der IPF-Folge gezeigt. Für den Konvergenzfall wird die stetige Abhängigkeit des Grenzwerts der IPF-Folge von der AusgangsmatrixDiese Dissertation analysiert das asymptotische Verhalten von zwei Varianten des iterativen proportionalen Anpassungsverfahrens (IPF-Verfahrens, iterative proportional fitting procedure), dem zweidimensionalen IPF-Verfahren und dem mehrdimensionalen IPF-Verfahren. Das zweidimensionale IPF-Verfahren verlangt als Eingabe eine nichtnegative Ausgangsmatrix sowie positive Zeilen- und Spaltenmarginalien. Davon ausgehend wird durch abwechselnde Skalierung der Zeilen und der Spalten eine Matrizenfolge errechnet, die sogenannte IPF-Folge. Drei Ansätze zur Konvergenzanalyse werden diskutiert. Der erste Ansatz basiert auf der Informationsdivergenz, der zweite auf einem invertierten geometrischen Mittel und der dritte auf einem L1-Fehlerfunktional. Mithilfe des informationstheoretischen Ansatzes werden notwendige und hinreichende Bedingungen für die Konvergenz der IPF-Folge gezeigt. Für den Konvergenzfall wird die stetige Abhängigkeit des Grenzwerts der IPF-Folge von der Ausgangsmatrix bewiesen. Unter gewissen Einschränkungen wird auch die stetige Abhängigkeit des Grenzwerts von den Marginalien gezeigt. Für den Divergenzfall werden die Konvergenz der IPF-Teilfolge entlang der Zeilenskalierungsschritte und die Konvergenz der IPF-Teilfolge entlang der Spaltenskalierungsschritte bewiesen. Die beiden Häufungspunkte der IPF-Folge werden informationstheoretisch charakterisiert. Unter gewissen Einschränkungen wird die stetige Abhängigkeit der Häufungspunkte von der Ausgangsmatrix und den Marginalien gezeigt. Für beide Fälle wird die Zusammenhangsstruktur der Ausgangsmatrix und der Häufungspunkte der IPF-Folge untersucht. Neue Resultate dieser Dissertation zum zweidimensionalen IPF-Verfahren sind die Konvergenz der IPF-Teilfolgen sowie die informationstheoretische Charakterisierung der Häufungspunkte und die Analyse ihrer Zusammenhangsstruktur im Divergenzfall. Ebenfalls neu sind die Stetigkeitsaussagen in beiden Fällen. Das mehrdimensionale IPF-Verfahren verlangt als Eingabe eine nichtnegative Ausgangstafel und mehrere positive Marginaltafeln. Davon ausgehend wird durch zyklische Skalierung eine Tafelfolge errechnet, die sogenannte IPF-Folge. Mithilfe des informationstheoretischen Ansatzes werden notwendige und hinreichende Bedingungen für die Konvergenz der IPF-Folge gezeigt. Für den Konvergenzfall wird die stetige Abhängigkeit des Grenzwerts der IPF-Folge von der Ausgangstafel bewiesen. Für den Divergenzfall legen numerische Simulationen die Konvergenz jeder IPF-Teilfolge nahe, entlang welcher an dieselbe Marginaltafel angepasst wird. Diese Hypothese wird in zwei Spezialfällen bewiesen. Für den allgemeinen Fall wird die Nichtexistenz einer universellen variationellen Charakterisierung der Grenzwerte dieser IPF-Teilfolgen gezeigt. Neue Resultate dieser Dissertation zum mehrdimensionalen IPF-Verfahren sind die Konvergenz der IPF-Teilfolgen in einem der beiden Spezialfälle sowie die Nichtexistenz einer universellen variationellen Charakterisierung der Grenzwerte dieser IPF-Teilfolgen im allgemeinen Divergenzfall. Ebenfalls neu ist die Stetigkeitsaussage im Konvergenzfall.show moreshow less
  • This thesis analyses the asymptotic behaviour of two variants of the iterative proportional fitting procedure (IPF procedure), the two-dimensional IPF procedure and the multidimensional IPF procedure. The two-dimensional IPF procedure takes as input a non-negative matrix and positive row and column marginals. It then generates a sequence of matrices, called the IPF sequence, by alternately scaling rows and columns. Three approaches to an analysis of convergence are discussed. The first approach is based on information divergence, the second on an inverted geometric mean and the third on an L1-error function. By using the information divergence approach, necessary and sufficient conditions for convergence of the IPF sequence are shown. For the case of convergence, continuous dependence of the limit of the IPF sequence on the input matrix is proven. Under certain restrictions, continuous dependence of the limit on the marginals is also shown. For the case of divergence, convergence ofThis thesis analyses the asymptotic behaviour of two variants of the iterative proportional fitting procedure (IPF procedure), the two-dimensional IPF procedure and the multidimensional IPF procedure. The two-dimensional IPF procedure takes as input a non-negative matrix and positive row and column marginals. It then generates a sequence of matrices, called the IPF sequence, by alternately scaling rows and columns. Three approaches to an analysis of convergence are discussed. The first approach is based on information divergence, the second on an inverted geometric mean and the third on an L1-error function. By using the information divergence approach, necessary and sufficient conditions for convergence of the IPF sequence are shown. For the case of convergence, continuous dependence of the limit of the IPF sequence on the input matrix is proven. Under certain restrictions, continuous dependence of the limit on the marginals is also shown. For the case of divergence, convergence of the IPF subsequence along the row scaling steps and convergence of the IPF subsequence along the column scaling steps are proven. The two limit points of the IPF sequence are characterised using information divergence. Under certain restrictions, continuous dependence of the limit points on the input matrix and the marginals is shown. For both cases, the connectedness structure of the input matrix and the limit points of the IPF sequence is analysed. Original results of this thesis regarding the two-dimensional IPF procedure include convergence of the IPF subsequences as well as the characterisation of the limit points and the analysis of their connectedness structure in the case of divergence. The continuity statements for both cases are original as well. The multidimensional IPF procedure takes as input a non-negative table and several positive marginal tables. It then generates a sequence of tables, called the IPF sequence, by cyclical scaling. By using the information divergence approach, necessary and sufficient conditions for convergence of the IPF sequence are shown. For the case of convergence, continuous dependence of the limit of the IPF sequence on the input table is proven. For the case of divergence, numerical simulations suggest convergence of each IPF subsequence along which the same marginal table is fitted. This conjecture is proven for two special cases. For the general case, non-existence of a universal variational characterisation of the limits of these IPF subsequences is shown. Original results of this thesis regarding the multidimensional IPF procedure include convergence of the IPF subsequences in one of the special cases and the non-existence of a universal variational characterisation of the limits of these IPF subsequences in the general case of divergence. The continuity statement for the case of convergence is original as well.show moreshow less

Download full text files

Export metadata

Statistics

Number of document requests

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Christoph Gietl
URN:urn:nbn:de:bvb:384-opus4-29801
Frontdoor URLhttps://opus.bibliothek.uni-augsburg.de/opus4/2980
Advisor:Friedrich Pukelsheim
Type:Doctoral Thesis
Language:German
Publishing Institution:Universität Augsburg
Granting Institution:Universität Augsburg, Mathematisch-Naturwissenschaftlich-Technische Fakultät
Date of final exam:2015/01/30
Release Date:2015/03/31
Tag:Divergenz; Häufungspunkte; Informationsdivergenz; alternierende Minimierung
GND-Keyword:Iteratives proportionales Anpassungsverfahren; Asymptotik; Matrix <Mathematik>; Kontingenztafel; Statistik; Konvergenz
Institutes:Mathematisch-Naturwissenschaftlich-Technische Fakultät
Mathematisch-Naturwissenschaftlich-Technische Fakultät / Institut für Mathematik
Dewey Decimal Classification:5 Naturwissenschaften und Mathematik / 51 Mathematik / 510 Mathematik
Licence (German):Deutsches Urheberrecht mit Print on Demand