Gflops und Supercomputer
Vor einigen Tagen habe ich in der ct‘ einen Artikel über die neueste TOP 500 und NVidias neues Schlachtschiff.GTX 280 gelesen. Die TOP 500 Liste ist die Liste mit den weltweit schnellsten Computern, üblicherweise eingesetzt für die Forschung im staatlichen oder geschäftlichen Umfeld (Ein Crash ist billiger simuliert als dafür ein Auto an die Wand zu fahren).Falls sie auch in dieser Liste erscheinen möchten: Das letzte System ist ein Blade Center HS21 mit 1488 Xeon Prozessoren mit 3 GHz und einer mittleren Leistung von 9 Teraflops.
Es gibt einen Trend und eine Neuerung in der derzeitigen Liste. Der Trend geht weg von den PC Prozessoren von Intel, AMD und IBM und hin zu den embedded Varianten des Power PC Prozessors, eigentlich gedacht als leistungsfähiger Controller in Fahrzeugen und anderen Steuerungen. Deren Leistung ist zwar deutlich kleiner als die eines Quad Cores und sie sind auch niedriger getaktet. doch der Stromverbrauch ist noch kleiner. Das spart nicht nur Stromkosten für den Computer sondern entlastet auch die Klimaanalage die heute ein gravierender Kostenfaktor geworden ist. Mehr Platz brauchen die Prozessoren nicht, denn ohne voluminöse Kühlkörper kann man sie viel dichter packen.
Die Neuerung ist die neue Nummer 1 der Liste, obwohl noch nicht einmal voll bestückt. Es ist der RoadRunner in Los Alamos, der Atombombenexplosionen simulieren soll. Mit 122240 Cell Prozessoren knackte er erstmals die Petaflop Grenze. Auch hier werkeln keine PC Prozessoren, sondern der Cell Prozessor, den IBM eigentlich für die Playstation 3 entwickelt wurde, aber heute als Rechenknecht angeboten wird. Die Version für Supercomputer unterscheidet sich vom Cell Prozessor in der Playstation 2, dass sie auch doppelte Genauigkeit schnell rechnen kann. das spielt für Spiele keine Rolle (einfache Genauigkeit hat Rundungsfehler an der 7-8 Dezimalstelle bei Bildschirminhalten die maximal 4 stellige Koordinaten haben ist dies weitaus besser als man braucht).
Der Cell Prozessor ist deswegen so schnell, weil er nur einen Power CPU Kern hat für die allgemeine Arbeit und das verteilen der Daten und 8 sehr schnellen, hochgradig parallelisierten Rechenwerken, die sehr schnell Berechnungen durchführen. Noch etwas weiter geht NVIDA mit ihrem Grafikprozessor GTX 280, den man bald auf den neuen Grafikkarten finden wird. 240 Rechenwerke sind eigentlich für Grafikoperationen zuständig und erreichen dort eine enorme Leistung von 833 GFlops. Auch dieser Wert gilt für einfache Genauigkeit, doch selbst wenn er im doppelt genauen Modus auf ein Achtel zurückgeht ist dies absolut noch eine Menge. Anstatt 122000 Cell Prozessoren hätten auch 10000 dieser Grafikprozessoren ausgereicht um die Petaflop Marke zu knacken. Gegen PC Prozessoren sieht der Vergleich noch besser aus. Es gibt noch keine Pläne von NVidia den Prozessor losgelöst von einer Grafikkarte als reinen Rechenknecht anzubieten. Doch es gibt Software für den PC um die GPU für andere Zwecke zu nutzen. Eine Software transkodiert z.b. Video auf der GPU und ist 8-10 mal schneller als eine reine PC Lösung. Ich denke irgend jemand wird dann mal auf die Idee kommen einen Verbund von PC’s mit High-end Grafikkarten als Supercomputer zu nutzen. Wenn man nicht so viel Geld hat wird man erfinderisch. Vor ein paar Jahren gelang das einmal mit der alten Playstation 2. Der praktische Nutzen des Clusters war aber durch den kleinen Speicher der Playstation begrenzt, doch es zeigte dass man ein Gerät recht gute zweckentfremden kann für eine Aufgabe, für die es gar nicht vorgesehen ist.
Warum schreibe ich dies? Nun bislang war es immer so, das Entwicklungen bei den Supercomputern zeitverzögert auch im PC Einzug hielten. Die Probleme bei hohen Anforderungen treten dort auf und die Lösungen werden dann vom PC Sektor übernommen: Caches, synchron arbeitender Speicher, Pipelines, Parallisierung und Multi-Cores. das alles wurde bei den Supercomputern entwickelt und findet sich heute in jedem PC. Daher ist ein Blick auf die Entwicklung in diesem Gebiet immer lohnend. Zuletzt noch eine kleine Tabelle, die mal einen etwas anderen Blick auf die Prozessoren wirft:
Prozessor | Takt | Leistung [GFlops] | Leistung [Gflops/GHz] | Stromverbrauch | Gflop/Watt | |
---|---|---|---|---|---|---|
GTX 280 | 1296 MHz | 116 | 89.5 | 236 Watt | 0.38 | |
Powercell 8Xi | 3200 MHz | 12.8 | 4.0 | 92 Watt | 0.14 | |
AMD Quadcore | 2100 MHz | 8.4 | 4.0 | 125 Watt | 0.067 | |
Power PC 450 | 850 MHz | 3.4 | 4.0 | 14 Watt (Kompletter Knoten) | 0.24 (kompletter Knoten) |
Für den Power PC war kein Stromverbrauch des Prozessors alleine in Erfahrung zu bringen, sondern nur der des ganzen Systems wozu auch Speicher und Netzverbindungen und Festplatten gehören. Trotzdem zeigt dies die Effizienz dieses Prozessors, auch wenn sein Takt nicht sehr hoch ist.
Ein Beispiel für die Nutzung von GPUs von Nvidia ist z.B. der FASTRA:
http://youtube.com/watch?v=TWNVnTypkoY
Interresant sind auch selbstoptimierende FPGA-Cluster:
Google TechTalks, February 28, 2006
http://youtube.com/watch?v=_ILu5SMis9E
oder
Das IANUS-Projekt:
http://df.unife.it/janus/
*Mal die alten Sachen wieder ausbuddel*
Zu „Ich denke irgend jemand wird dann mal auf die Idee kommen einen Verbund von PCâ
Tja nenn mich Prophet
Mach doch einen Kurs für Computer-Propheten auf.