Performance-Optimierung für zukünftige Hardware Um auf Computern hohe Geschwindigkeiten für numerische
Anwendungen zu
erzielen, müssen die charakteristischen Merkmale der
ausführenden Plattform
berücksichtigt werden. In Zukunft erwartet man eine weiter
steigende Anzahl an
Rechenkernen und eine weitere Etablierung heterogener
Architekturen mit
Beschleunigern, aber auch rekonfigurierbare Einheiten wären
denkbar. Deshalb
erforschen und entwickeln wir leistungssteigernde
Programmiertechniken für
moderne und alternative Hardware, also Mehrkernprozessoren,
Grafikkarten, und
andere Beschleunigerarchitekturen.
| Projektleitung: Prof. Dr. Ulrich Rüde
Beteiligte: Prof. Dr.-Ing. Harald Köstler, Akad. Dir.
Stichwörter: Performance-Optimierung; Mehrkernprozessoren; Beschleuniger; GPGPU
Beginn: 1.6.2006
Kontakt: Köstler, Harald Telefon +49 9131 85 28359, Fax +49 9131 85 28928, E-Mail: harald.koestler@fau.de
| Publikationen |
---|
Ritter, Daniel ; Stürmer, Markus ; Rüde, Ulrich: A fast-adaptive composite grid algorithm for solving the free-space Poisson problem on the cell broadband engine. In: Numerical Linear Algebra with Applications 17 (2010), Nr. 2-3, S. 291-305 [doi>10.1002/nla.697] | Stürmer, Markus ; Köstler, Harald ; Rüde, Ulrich: Optimized fast wavelet transform utilizing a multicore-aware framework for stencil computations. In: University of Iceland (Veranst.) : Proceedings of Para 2010 (Para 2010: State of the Art in Scientific and Parallel Computing Reykjavik, Iceland 06.--09.06.2010). 2010, S. 1-4. | Bartuschat, Dominik ; Stürmer, Markus ; Köstler, Harald: An Orthogonal Matching Pursuit Algorithm for Image Denoising on the Cell Broadband Engine. In: Weglarz, Jan ; Wyrzykowski, Roman ; Szymanski,Boleslaw (Veranst.) : Parallel Processing and Applied Mathematics (8th International Conference, PPAM 2009 Wroclaw 13.09. - 16.09.2009). Bd. 5057. Berlin Heidelberg : Springer, 2010, S. 557-566. (Lecture Notes in Computer Science) - ISBN 978-3-642-14389-2 [doi>10.1007/978-3-642-14390-8_58] | Stürmer, Markus ; Wellein, Gerhard ; Hager, Georg ; Köstler, Harald ; Rüde, Ulrich: Challenges and Potentials of Emerging Multicore Architectures. In: Wagner, S. ; Steinmetz, M. ; Bode, A. ; Brehm, M. (Hrsg.) : High Performance Computing in Science and Engineering Garching-Munich 2007 (Third Joint HLRB and KONWIHR Status and Result Workshop Garching 03.12.-04.12.2007). Berlin Heidelberg : Springer, 2009, S. 551-566. - ISBN 978-3-540-69181-5 | Stürmer, Markus ; Götz, Jan ; Richter, G. ; Dörfler, Arnd ; Rüde, Ulrich: Fluid flow simulation on the Cell Broadband Engine using the lattice Boltzmann method. In: Computers and Mathematics with Applications 58 (2009), Nr. 5, S. 1062-1070 [doi>10.1016/j.camwa.2009.04.006] | Stürmer, Markus: Implementing Stencil-Based Codes on the Cell Broadband Engine Efficiently.Vortrag: CECAM Workshop on Algorithmic Re-Engineering for Modern Non-Conventional Processing Units, cecam, Lugano, 30.09.2009 | Köstler, Harald: Porting Numerical Algorithms to GPUs.Vortrag: CECAM Workshop on Algorithmic Re-Engineering for Modern Non-Conventional Processing Units, cecam, Lugano, 30.09.2009 | Stürmer, Markus ; Eitzinger, Jan ; Rüde, Ulrich: Optimising a 3D multigrid algorithm for the IA-64 architecture. In: Int. J. Computational Science and Engineering 4 (2008), Nr. 1, S. 29-35 | Wellein, Gerhard ; Hager, Georg ; Rüde, Ulrich: What's next? Evaluating Performance and Programming Approaches for Emerging Computer Technologies. In: High Performance Computing at RRZE (2008), S. 42-45 | Stürmer, Markus ; Köstler, Harald ; Rüde, Ulrich: Fast wavelet transform utilizing a multicore-aware framework. In: Jonasson, K. (Hrsg.) : Applied Parallel and Scientific Computing. Bd. 7134. Berlin, Heidelberg, New York : Springer, 2012, (Lecture Notes in Computer Science), S. 313-323. |
|