UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 Lehr-
veranstaltungen
   Personen/
Einrichtungen
   Räume   Forschungs-
bericht
   Publi-
kationen
   Internat.
Kontakte
   Examens-
arbeiten
   Telefon &
E-Mail
 
 
 Darstellung
 
Druckansicht

 
 
Einrichtungen >> Technische Fakultät (TF) >> Department Informatik (INF) >> Lehrstuhl für Informatik 10 (Systemsimulation) >>
Performance-Optimierung für zukünftige Hardware

Um auf Computern hohe Geschwindigkeiten für numerische Anwendungen zu erzielen, müssen die charakteristischen Merkmale der ausführenden Plattform berücksichtigt werden. In Zukunft erwartet man eine weiter steigende Anzahl an Rechenkernen und eine weitere Etablierung heterogener Architekturen mit Beschleunigern, aber auch rekonfigurierbare Einheiten wären denkbar. Deshalb erforschen und entwickeln wir leistungssteigernde Programmiertechniken für moderne und alternative Hardware, also Mehrkernprozessoren, Grafikkarten, und andere Beschleunigerarchitekturen.
Projektleitung:
Prof. Dr. Ulrich Rüde

Beteiligte:
Prof. Dr.-Ing. Harald Köstler, Akad. Dir.

Stichwörter:
Performance-Optimierung; Mehrkernprozessoren; Beschleuniger; GPGPU

Beginn: 1.6.2006

Kontakt:
Köstler, Harald
Telefon +49 9131 85 28359, Fax +49 9131 85 28928, E-Mail: harald.koestler@fau.de
Publikationen
Ritter, Daniel ; Stürmer, Markus ; Rüde, Ulrich: A fast-adaptive composite grid algorithm for solving the free-space Poisson problem on the cell broadband engine. In: Numerical Linear Algebra with Applications 17 (2010), Nr. 2-3, S. 291-305
[doi>10.1002/nla.697]
Stürmer, Markus ; Köstler, Harald ; Rüde, Ulrich: Optimized fast wavelet transform utilizing a multicore-aware framework for stencil computations. In: University of Iceland (Veranst.) : Proceedings of Para 2010 (Para 2010: State of the Art in Scientific and Parallel Computing Reykjavik, Iceland 06.--09.06.2010). 2010, S. 1-4.
Bartuschat, Dominik ; Stürmer, Markus ; Köstler, Harald: An Orthogonal Matching Pursuit Algorithm for Image Denoising on the Cell Broadband Engine. In: Weglarz, Jan ; Wyrzykowski, Roman ; Szymanski,Boleslaw (Veranst.) : Parallel Processing and Applied Mathematics (8th International Conference, PPAM 2009 Wroclaw 13.09. - 16.09.2009). Bd. 5057. Berlin Heidelberg : Springer, 2010, S. 557-566. (Lecture Notes in Computer Science) - ISBN 978-3-642-14389-2
[doi>10.1007/978-3-642-14390-8_58]
Stürmer, Markus ; Wellein, Gerhard ; Hager, Georg ; Köstler, Harald ; Rüde, Ulrich: Challenges and Potentials of Emerging Multicore Architectures. In: Wagner, S. ; Steinmetz, M. ; Bode, A. ; Brehm, M. (Hrsg.) : High Performance Computing in Science and Engineering Garching-Munich 2007 (Third Joint HLRB and KONWIHR Status and Result Workshop Garching 03.12.-04.12.2007). Berlin Heidelberg : Springer, 2009, S. 551-566. - ISBN 978-3-540-69181-5
Stürmer, Markus ; Götz, Jan ; Richter, G. ; Dörfler, Arnd ; Rüde, Ulrich: Fluid flow simulation on the Cell Broadband Engine using the lattice Boltzmann method. In: Computers and Mathematics with Applications 58 (2009), Nr. 5, S. 1062-1070
[doi>10.1016/j.camwa.2009.04.006]
Stürmer, Markus: Implementing Stencil-Based Codes on the Cell Broadband Engine Efficiently.Vortrag: CECAM Workshop on Algorithmic Re-Engineering for Modern Non-Conventional Processing Units, cecam, Lugano, 30.09.2009
Köstler, Harald: Porting Numerical Algorithms to GPUs.Vortrag: CECAM Workshop on Algorithmic Re-Engineering for Modern Non-Conventional Processing Units, cecam, Lugano, 30.09.2009
Stürmer, Markus ; Eitzinger, Jan ; Rüde, Ulrich: Optimising a 3D multigrid algorithm for the IA-64 architecture. In: Int. J. Computational Science and Engineering 4 (2008), Nr. 1, S. 29-35
Wellein, Gerhard ; Hager, Georg ; Rüde, Ulrich: What's next? Evaluating Performance and Programming Approaches for Emerging Computer Technologies. In: High Performance Computing at RRZE (2008), S. 42-45
Stürmer, Markus ; Köstler, Harald ; Rüde, Ulrich: Fast wavelet transform utilizing a multicore-aware framework. In: Jonasson, K. (Hrsg.) : Applied Parallel and Scientific Computing. Bd. 7134. Berlin, Heidelberg, New York : Springer, 2012, (Lecture Notes in Computer Science), S. 313-323.
UnivIS ist ein Produkt der Config eG, Buckenhof