Abstract
An ausgewählten Moduln wird der Einfluß der Speicherhierarchie des T9000 auf die Implementierungsstrategie für die BLAS untersucht. Die Notwendigkeit und die Art des Unrolling von DO-Schleifen wird dargestellt und an einem Performance-Simulator für den T9000 überprüft. Ein für eine maschinennahe Implementierung geeigneter Algorithmus für die blockweise Matrix-Matrix-Multiplikation wird formuliert und in FORTRAN auf einer SPARCstation 10/30 getestet.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
References
The T9000 transputer hardware reference manual, INMOS Limited, 1993
Lawson, C R; Hanson, R. Kincaid, D. Krogh, F. Basic Linear Algebra Subprograms for Fortran Usage, ACM Transactions on Mathematical Software 5, 308–323,1979
Dongarra, J.; Du Croz J.; Hammerling S.; Hanson R.; An Extended Set of FORTRAN Basic Linear Algebra Subprograms, ACM Transactions on Mathematical Software 14(1), 117, 1988
Dongarra, J.; Du Croz J.jDuif I.: Hammarling S.; A Set of Level 3 Basic Linear Algebra Subprograms, ACM Transactions on Mathematical Software 16(1), 117, 1990
Anderson, E.; Bai, Z.; Bischof, C.; Demmel, J.; Dongarra, J.; Du Croz J.; Grennbaum, A.; Hammarling S.; McKenney A.; Ostrouchov S.; Sorensen D.; LA- PACK Users’ Guide, SIAM, Philadelphia, PA, 1992
Frommer, A.; Lösung linearer Gleichungssysteme auf Parallelrechnera, Braunschweig 1990
Reinhardt, G.; Eine allgemeine Strategie des Tuning der BLAS-1 im maschinennahen Code - Aussagen zum Tuning für den Transputer T800, Abstraktband des 4. bundesweiten Transputer-Anwender-Treffens TAT’92, Klinikum der RWTH Aachen, 22. und 23. September 1992
Bader, G.; Przywara, B.; T9000 - A Preliminary Evaluation of Arithmetic Performance; Preprint-Reihe des IWR der Universität Heidelberg; Preprint 93–21
Dongarra, J.; Mayes, P.; Radicati di Brozolo G.; The IBM RISC Sytem/6000 and lineare algebra operations; Supercomputer 44, VIII-4 April 1991
ANSI/IEEE standard 754–1985 - An American national standard for binary floating-point arithmetic
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1994 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Reinhardt, G. (1994). Zur maschinennahen Implementation und Performance von Basic Linear Algebra Subroutines (BLAS) Level 1, 2 und 3 auf dem Transputer T9000. In: Hektor, J., Grebe, R. (eds) Parallele Datenverarbeitung mit dem Transputer. Informatik aktuell. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-78901-4_5
Download citation
DOI: https://doi.org/10.1007/978-3-642-78901-4_5
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-57830-7
Online ISBN: 978-3-642-78901-4
eBook Packages: Springer Book Archive