{"id":7184,"date":"2012-10-14T00:51:35","date_gmt":"2012-10-13T22:51:35","guid":{"rendered":"http:\/\/www.bernd-leitenberger.de\/blog\/?p=7184"},"modified":"2012-10-13T18:53:31","modified_gmt":"2012-10-13T16:53:31","slug":"das-aufkommen-der-parallelrechner-teil-1","status":"publish","type":"post","link":"https:\/\/www.bernd-leitenberger.de\/blog\/2012\/10\/14\/das-aufkommen-der-parallelrechner-teil-1\/","title":{"rendered":"Das Aufkommen der Parallelrechner &#8211; Teil 1"},"content":{"rendered":"<p>In den Achtziger Jahren war der Begriff &#8222;Supercomputer&#8220; praktisch simultan belegt mit der Architektur eines Vektorrechners. Diese von Seymour Cray und seinen Nachfolgern bei Cray Research entwickelte und eingesetzte Architektur, erlaubte es pro Takt eine Registeroperation durchzuf&uuml;hren. Im Normalfall besteht die Ausf&uuml;hrung eines Befehls aus drei Operationen:<\/p>\n<ul>\n<li>Dem Holen aus dem Speicher (Fetch)<\/li>\n<li>Dem Dekodieren (was soll eigentlich gemacht werden, Decode)<\/li>\n<li>Dem Ausf&uuml;hren (Execute)<\/li>\n<\/ul>\n<p>Bei einer Vektoroperation fielen die ersten Schritte nur einmal an, lediglich pro Registeroperation gab es einen weiteren Ausf&uuml;hrungszyklus. So war die Ausf&uuml;hrung nat&uuml;rlich deutlich beschleunigbar, wenn die Anwendung so gestrickt war, das ein und dieselbe Rechnung bei sehr vielen Zahlen durchgef&uuml;hrt wird. Das war bei vielen Simulationen gegeben, bei denen man in Tausenden oder Millionen von Zellen immer mit denselben Gleichungen rechnete. War dies nicht der Fall, so waren Vektorrechner deutlich langsamer.<!--more--><\/p>\n<p>Der Preis f&uuml;r die damaligen Supercomputer war, dass sie aus eigenen Bausteinen bestanden, die speziell f&uuml;r sie gefertigt wurden. Bei Cray sehr lange in ECL-Technologie, einer Halbleitertechnologie mit sehr geringen Schaltzeiten, aber sehr hoher Verlustleistung, die dadurch keine sehr hohe Integration zulie&szlig;. Die Cray 1 wog 5,5 t und hatte eine Verlustleistung von &uuml;ber 115 kW. Auch wenn die Firma in den achtziger Jahren dazu &uuml;berging, anstatt ECL-Bausteinen zumindest beim Speicher schnelles statisches RAM einzusetzen, &auml;nderte sich daran nichts, dass die CPU immer noch aus ECL-Bausteinen bestand.<\/p>\n<h2>Die Anf&auml;nge<\/h2>\n<p>Zur selben Zeit gab es aber auch die ersten Versuche einen schnellen Rechner aus Standard-Mikroprozessoren zusammenzustellen. Der erste war der &#8222;Cosmic Cube&#8220;, der ab 1981 als dreidimensionaler W&uuml;rfel aus 4 x 4 x 4 = 64 Prozessoren entstand. Anfangs wurden 8086 mit 8087 Coprozessor gew&auml;hlt, das war eine Notl&ouml;sung, weil nur die 8086 damals einen numerischen Coprozessor hatte, der die Geschwindigkeit bei Flie&szlig;kommaoperationen um bis zum Faktor 100 beschleunigte.<\/p>\n<p>Urspr&uuml;nglich nur als Experimentalprojekt gedacht, war der Rechner immerhin 5-10 mal schneller als der Standardminicomputer dieser Tage, die VAX 11\/780. Dabei kostete er mit Herstellungskosten von 80.000 Dollar nur halb so viel. Der Cosmic Cube konnte noch nicht in die Bereiche eines Supercomputers vorsto&szlig;en, aber immerhin einen Minicomputer ersetzen,<\/p>\n<p>1986 entstand mit dem 68020 Prozessor eine weitere Version, die mit einem Weitek Coprozessor bei 8 MHz 16 MFlops pro Knoten (aus zwei Prozessoren) erreichte. Ein 128 Knotensystem erreichte 1989 bei Anwendungen eine Geschwindigkeit von 500 MFlops, womit dieser Cosmic Cube schon in den Bereich der Supercomputer vorstie&szlig;.<\/p>\n<p>Die Firma NCube baute basierend auf selbst entwickelten RISC-Chips Rechner mit bis zu 1024 Prozessoren. Intel ver&ouml;ffentlichte mit dem iPSC (Intel Personal Supercomputer) eine Serie basierend zuerst auf dem 80286\/7 und sp&auml;ter (ab 1990) auf dem i860. 1990 erreichte eine iPSC\/860 mit 128 Prozessoren eine Maximalleistung von 7,6 GFlops zu dem moderaten Preis von 5,5 Millionen Mark.<\/p>\n<p>Anfangs suchte man nach der besten Vorgehensweise wie man die Prozessoren vernetzt und optimal auslastet. Die Rechner der Firma Thinking Maschine zeigen dies sehr deutlich. Sie alle hatten die Bezeichnung &#8222;CM&#8220; f&uuml;r Connection Maschine. Die erste CM-1 hatte schon 65536 Prozessoren, die jedoch nur jeweils 1 Bit verarbeiteten. Sie waren in Form eines Hypercubes verbunden. Die CM-1 war noch kein Universalrechner, sondern f&uuml;r die Programmierung in LISP f&uuml;r Probleme aus dem Bereich k&uuml;nstlicher Intelligenz ausgelegt.<\/p>\n<p>CM-2 setzte das SIMD Prinzip ein: Single Instruction, Multiple Data. Ein Kontrollprozessor schickte einen Befehl an die Rechenprozessoren und diese bearbeiteten die Daten im lokalen Speicher. Das Prinzip des Vektorrechners ist solch eine SIMD Implementierung. Eine zweie M&ouml;glichkeit und bei vollwertigen Mikroprozessoren besser geeignet ist die MIMD Vorgehensweise: Multiple Instruction, Multiple Data. Dabei arbeitet jeder Mikroprozessor ein eigenes Programm mit eigenen Daten ab. Die CM-2 war die erste universell einsetzbare. Die !-Bit Prozessoren wurden durch einen Weitek Coprozessor unterst&uuml;tzt, der von je 32 Prozessoren geteilt wurde.<\/p>\n<p>Mit der CM-5 setzte die gleiche Firma beide Verfahren zusammen um. Sie wechselte auch auf normale Industrieware. Die CPU war nun ein Sun SPARC 32-Bit-Prozessor, der alleine arbeiten konnte. Er war der MIMD Teil. Er wurde jedoch um eine eigens entwickelte Vektoreinheit erg&auml;nzt, die Vektoroperationen 25-mal schneller als die SPARC CPU abarbeiten konnte. eine CM-5 mit 1024 Prozessoren erreichte 128 GFlops und war damals (1992) der schnellste Rechner der Welt, mehr als doppelt so schnell wie eine Cray 90. Damit gab es Ende der achtziger Jahre schon eine Alternative zu den Vektorrechnern die deutlich preiswerter waren.<\/p>\n<p>Trotzdem blieben viele Kunden bei den Vektorrechnern, obwohl sie Anfang der neunziger Jahren weder die schnellsten Rechner waren, noch preisg&uuml;nstig. es waren die praktischen Fortschritte die (noch) den Ausschlag f&uuml;r die Vektorrechner gaben. Vektorrechner hatten nun zwar auch mehrere Knoten, doch stellten die sich aus Programmsicht als mehrere Recheneinheiten dar. Alle Rechner griffen aber auf denselben Arbeitsspeicher zu. Es gab also <strong>ein<\/strong> Programm, das alle Knoten steuerte. Dagegen gab es bei den Multiprozessorrechnern <strong>pro Prozessor ein Programm<\/strong>. War eine Routine abgearbeitet, so mussten sich die Prozessoren synchronisieren und die Rechenergebnisse austauschen &#8211; zumindest bei den Anwendungen, die nicht isoliert auf einem Prozessor laufen konnten.<\/p>\n<h2>Massive paralleles Processing (MPP) setzt sich durch<\/h2>\n<p>In den neunziger Jahren f&uuml;hrte die Einf&uuml;hrung eines schnellen gemeinsamen Speichers f&uuml;r den Datenaustausch zum Durchbruch der massive parallelen Rechnern. (MPR) Es war aber auch ein anderer Grund f&uuml;r den Wechsel zu dieser Technologie entscheidend: Es gelang kaum noch die ECL-Technologie in der Geschwindigkeit zu steigern. Von 1976 bis 1990 stiegt die Taktfrequenz einer Cray von 80 auf 438 MHz. In derselben Zeit stieg sie bei Mikroprozessoren von 4 auf 40 MHz und die Verarbeitungsbreite stieg von 8 auf 32 Bit. Alks dann die Verarbeitungsbreite kaum noch anstieg stieg die Taktfrequenz noch schneller an. Etwa 20 Jahre sp&auml;ter ist auch die Taktfrequenz bei Mikroprozessoren an eine Grenze gekommen, die kaum noch steigerbar ist. bei mehr als 3 GHz wird die Luft d&uuml;nn.<\/p>\n<p>Schlie&szlig;lich wechselte auch Cray Mitte der neunziger Jahre von der Technik der Vektorrechner auf den Paralellbetrieb vieler Prozessoren. Speziall&ouml;sungen, wie die von NCube oder Erweiterungen g&auml;ngiger Prozessoren wie bei der CM-5 verschwanden nach und nach vom Markt wie der Intel 860, der auch SIMD Instruktionen hatte. Heute dominieren die beiden Marktf&uuml;hrer bei PC-Prozessoren Intel und AMD auch bei den Supercomputern. Danach kommt IBM mit dem Power Prozessor, die nur wenige Systeme im Einsatz haben, daf&uuml;r aber diese sehr weit oben platziert (mit sehr vielen Prozessoren).<\/p>\n<p>Was bei immer mehr Knoten (so wird meistens ein austauschbarer oder erweiterbarer Teil eines Computers genannt, das kann eine Platine mit mehreren Prozessoren oder ein Rack-Einschub sein) aufkam, war die Forderung Daten auszutauschen. Fr&uuml;he Konzepte nutzten dazu noch einen gemeinsamen Speicher. Doch zum einen wurde auch Speicher kaum noch schneller, da er meist aus billigem DRAM bestand, dessen Zugriffszeit sich kaum noch steigern l&auml;sst und zum andern gibt es mehr und mehr Konflikte bei immer mehr Prozessoren. Als Supercomputer mit vielen Prozessoren dann nicht mehr in einen Schrank passten, musste sowieso eine neue L&ouml;sung her. Fr&uuml;her wurden vorwiegend propriet&auml;re Netzwerke eingesetzt, heute dominieren normale Industrietechnologien wie Gigabit Ethernet oder 10G Ethernet oder Varianten des Infinibands.\u00a0 In der Vernetzung liegt heute die St&auml;rke der Firma Cray, die sonst auch nur Opterons wie alle anderen Hersteller einsetzt. Ihr Gemini-Interconnect ist ein propriet&auml;res System, aber um einiges leistungsf&auml;higer als andere L&ouml;sungen.<\/p>\n<p>So morgen kommt dann \u00a0Teil 2<\/p>\n","protected":false},"excerpt":{"rendered":"<p>In den Achtziger Jahren war der Begriff &#8222;Supercomputer&#8220; praktisch simultan belegt mit der Architektur eines Vektorrechners. Diese von Seymour Cray und seinen Nachfolgern bei Cray Research entwickelte und eingesetzte Architektur, erlaubte es pro Takt eine Registeroperation durchzuf&uuml;hren. Im Normalfall besteht die Ausf&uuml;hrung eines Befehls aus drei Operationen: Dem Holen aus dem Speicher (Fetch) Dem Dekodieren [&hellip;]<\/p>\n","protected":false},"author":169,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[4],"tags":[2946,2947,2905],"class_list":["post-7184","post","type-post","status-publish","format-standard","hentry","category-computer","tag-mpp","tag-parallelrechner","tag-vektorrechner","entry"],"a3_pvc":{"activated":false,"total_views":630,"today_views":0},"jetpack_featured_media_url":"","jetpack-related-posts":[{"id":18612,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/28\/galileos-cds-teil-2\/","url_meta":{"origin":7184,"position":0},"title":"Galileos CDS \u2013 Teil 2","author":"Bernd Leitenberger","date":"28. M\u00e4rz 2026","format":false,"excerpt":"So, heute geht es weiter mit Teil 2 \u00fcber Galileos CDS, dieser Beitrag schlie\u00dft nahtlos an den ersten Beitrag von gestern an, wie man schon an der ersten Textzeile sieht. Nach der Einleitung im ersten Teil geht es heute weiter damit warum der RCA 1802 genutzt wurde und was seine\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/191e4b0728de42829cf656027b84dc82","width":350,"height":200},"classes":[]},{"id":17895,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/01\/19\/nachlese-teststart-starship-itf-7\/","url_meta":{"origin":7184,"position":1},"title":"Nachlese Teststart Starship ITF-7","author":"Bernd Leitenberger","date":"19. Januar 2025","format":false,"excerpt":"Die erste Phase lief noch nach Plan. Das Starship mit der Seriennummer S33 und die SuperHeavy mit der Seriennummer B14 hoben mit 37 Minuten Versp\u00e4tung um 4:37 nachmittags lokaler Zeit ab. Der Flug selbst hatte einen genehmigten Startzeitraum von 10. bis zum 17. Januar 2025 mit jeweils einem Startfenster pro\u2026","rel":"","context":"In &quot;SpaceX&quot;","block_context":{"text":"SpaceX","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/spacex\/"},"img":{"alt_text":"","src":"https:\/\/vg06.met.vgwort.de\/na\/60231369830445f0b5712ad7af8fdc7a","width":350,"height":200},"classes":[]},{"id":18614,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/29\/galileos-cds-teil-3\/","url_meta":{"origin":7184,"position":2},"title":"Galileos CDS &#8211; Teil 3","author":"Bernd Leitenberger","date":"29. M\u00e4rz 2026","format":false,"excerpt":"So nun zum dritten Teil \u00fcber das prim\u00e4re Computersystem von Galileo, das CDS. Nachdem sich die ersten beiden Teile nur mit dem RCA 1802, warum er gew\u00e4hlt wurde und seiner Architektur befassten geht es heute um das Computersystem selbst. Der Artikel schlie\u00dft so an seine beiden Vorg\u00e4nger gestern und vorgestern\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/6e7f572a246b4ac395de9c260733b707","width":350,"height":200},"classes":[]},{"id":18469,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/11\/13\/operation-fishbowl\/","url_meta":{"origin":7184,"position":3},"title":"Operation Fishbowl","author":"Bernd Leitenberger","date":"13. November 2025","format":false,"excerpt":"Hallo, ich schreibe weiter an meinem Buch, die Auskopplung der Thor und Delta aus dem Buch \u00fcber die US-Tr\u00e4gerraketen. Und wie immer nutze ich die Zeit noch was zu erg\u00e4nzen. Seitens des Einsatzes der Thor bzw. Delta als Satellitentr\u00e4ger gibt es wenig Neues zu schreiben da habe ich schon beim\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/e\/e2\/Radiocarbon_bomb_spike.svg","width":350,"height":200,"srcset":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/e\/e2\/Radiocarbon_bomb_spike.svg 1x, https:\/\/upload.wikimedia.org\/wikipedia\/commons\/e\/e2\/Radiocarbon_bomb_spike.svg 1.5x"},"classes":[]},{"id":18393,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/09\/18\/die-falcon-9-eine-nachlese\/","url_meta":{"origin":7184,"position":4},"title":"Die Falcon 9 &#8211; eine Nachlese (1)","author":"Bernd Leitenberger","date":"18. September 2025","format":false,"excerpt":"Nachdem \"SimonVR\" mich darauf aufmerksam gemacht hat, dass mein Falcon 9 Artikel sowie der \u00fcber die Entwicklung der Falcon 9 doch etwas abgehangen ist, denke ich, mache ich mal einen Blog dazu. Zuerst mal, worum es hier NICHT geht: n\u00e4mlich eine Einsatzgeschichte der Falcon 9. Ebenso habe ich die wirtschaftliche\u2026","rel":"","context":"In &quot;SpaceX&quot;","block_context":{"text":"SpaceX","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/spacex\/"},"img":{"alt_text":"","src":"https:\/\/vg02.met.vgwort.de\/na\/8d7fcc876a9d4ed4b27890b8d59e8e87","width":350,"height":200},"classes":[]},{"id":18610,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/27\/galileos-cds-teil-1\/","url_meta":{"origin":7184,"position":5},"title":"Galileos CDS &#8211; Teil 1","author":"Bernd Leitenberger","date":"27. M\u00e4rz 2026","format":false,"excerpt":"Hall\u00f6chen, es wird Zeit das ich mich mal wieder melde. Es gab zwei Gr\u00fcnde, warum ich mich so rar gemacht habe. Das eine ist das es gerade nicht so viel aktuelles gibt, au\u00dfer einem Update zu Artemis, zu dem ich vielleicht noch etwas schreibe. W\u00e4hrend Trump das ganze Programm nach\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/4fb81c7bafbd4d9d88b5695abdb33d29","width":350,"height":200},"classes":[]}],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/7184","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/users\/169"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/comments?post=7184"}],"version-history":[{"count":0,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/7184\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/media?parent=7184"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/categories?post=7184"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/tags?post=7184"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}