Performanceanalyse und plattformspezifische Optimierungen am Beispiel des Grid-ALU-Prozessors

  • Sequentielle Programme können nicht vom Trend zu immer mehr Prozessorkernen profitieren. Zur Beschleunigung dieser Programme bedarf es neuer Architekturen. Ein Beispiel ist der Grid-ALU-Prozessor (GAP). Er ähnelt einer superskalaren Architektur, bei der eine dreidimensionale Struktur aus Funktionseinheiten zur Ausführung verwendet wird. Um bereits kompilierte Programme für die Ausführung auf dem GAP zu optimieren, kann der Post-Link-Optimierer GAPtimize verwendet werden. Dieses Tool unterstützt plattformspezifische Optimierungen, mit denen die Ausführungsgeschwindigkeit auf dem GAP durch Abschwächung negativer Einflussfaktoren erhöht werden kann. Mit einer automatischen Suche im Parameterraum werden Konfigurationen für den GAP ermittelt, die ein optimales Verhältnis aus Hardwareaufwand und Ausführungsgeschwindigkeit aufweisen. Diese Suche wird auf die Code-Optimierungen ausgedehnt. Durch die Verwendung von GAPtimize können signifikant bessere Ergebnisse erreicht werden.
  • A trend towards many-core processor designs is evident to make use of the quickly growing resources on a chip available for processor designs. Novel architectures are developed to also accelerate sequential legacy programs not being able to gain any profit from multiple cores. The Grid ALU Processor (GAP) resembling a superscalar processor with a three dimensional execution unit is used in this work as example. To exploit its features without the need of rewriting or even recompiling legacy applications for quicker execution on the GAP the post link optimizer GAPtimize is introduced. It supports platform specific optimizations to reduce properties of programs restraining GAP's performance. Each of these restraining forces is addressed by at least one optimization. In an automatic design space exploration, configurations for the GAP are worked out showing near-optimal effectiveness, so gaining the best performance from the hardware resources. The search is extended to codeA trend towards many-core processor designs is evident to make use of the quickly growing resources on a chip available for processor designs. Novel architectures are developed to also accelerate sequential legacy programs not being able to gain any profit from multiple cores. The Grid ALU Processor (GAP) resembling a superscalar processor with a three dimensional execution unit is used in this work as example. To exploit its features without the need of rewriting or even recompiling legacy applications for quicker execution on the GAP the post link optimizer GAPtimize is introduced. It supports platform specific optimizations to reduce properties of programs restraining GAP's performance. Each of these restraining forces is addressed by at least one optimization. In an automatic design space exploration, configurations for the GAP are worked out showing near-optimal effectiveness, so gaining the best performance from the hardware resources. The search is extended to code optimizations and it is demonstrated that GAPtimize can improve both performance and area effectiveness of the GAP.show moreshow less

Download full text files

Export metadata

Statistics

Number of document requests

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Ralf Jahr
URN:urn:nbn:de:bvb:384-opus4-18849
Frontdoor URLhttps://opus.bibliothek.uni-augsburg.de/opus4/1884
Advisor:Theo Ungerer
Type:Doctoral Thesis
Language:German
Publishing Institution:Universität Augsburg
Granting Institution:Universität Augsburg, Fakultät für Angewandte Informatik
Date of final exam:2012/02/09
Release Date:2012/08/07
Tag:target-specific optimizations; adaptive optimization; automatic design space exploration (ADSE); post-link optimization (PLO); whole program optimization (WPO)
GND-Keyword:Codeoptimierung; Superskalare Architektur
Institutes:Fakultät für Angewandte Informatik
Fakultät für Angewandte Informatik / Institut für Informatik
Fakultät für Angewandte Informatik / Institut für Informatik / Lehrstuhl für Systemnahe Informatik und Kommunikationssysteme
Dewey Decimal Classification:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik
Licence (German):Deutsches Urheberrecht mit Print on Demand