{"id":7096,"date":"2012-09-23T11:16:41","date_gmt":"2012-09-23T09:16:41","guid":{"rendered":"http:\/\/www.bernd-leitenberger.de\/blog\/?p=7096"},"modified":"2012-09-23T11:16:41","modified_gmt":"2012-09-23T09:16:41","slug":"der-vektorrechner","status":"publish","type":"post","link":"https:\/\/www.bernd-leitenberger.de\/blog\/2012\/09\/23\/der-vektorrechner\/","title":{"rendered":"Der Vektorrechner"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" class=\"alignleft\" src=\"\/img\/cray1.jpeg\" alt=\"\" width=\"244\" height=\"200\" \/>Seymour Cray&#8217;s Beitrag zu den Computern war schon als ich mich in den Achtzigern daf&uuml;r interessierte legend&auml;r. Cray war urspr&uuml;nglich bei CDC (Control Data Corporation) f&uuml;r die Entwicklung der CD-6600 und 7600 verantwortlich, den schnellsten Computern ihrer Zeit und auch in ihrer Architektur richtungsweisend. Aber die Entwicklung war teuer und es kam zu Problemen als die CD 8600 sich als nicht entwerfbar entpuppte. Cray trennte sich von CDC einvernehmlich und gr&uuml;ndete seine eigene Firma.<\/p>\n<p>Schon das Erstling, die Cray 1 war 1976 ein ganz gro&szlig;er Wurf. Er war schneller als jeder andere Rechner seiner Zeit, und das nicht nur ein bisschen, sondern gleich viermal schneller. Er sah stylisch aus (und war auch noch als Sitzbank nutzbar). Der ganze Rechner war auf Geschwindigkeit ausgelegt. So kam die Form einer gro&szlig;en Garnrolle dadurch, dass die Verbindungsl&auml;nge minimal sein sollte. Alle Kabel waren ein vielfaches von 30 cm lang. Kein Kabel d&uuml;rfte l&auml;nger als 72 Inch sein, da ein Signal\u00a0 dann 12,5 ns brauchte &#8211; die Taktzeit des Rechners. Das f&uuml;hrte auch zu dem kompakten Aufbau<!--more--><\/p>\n<p>Das entscheidende war aber das Cray das Prinzip des Vectorrechners einf&uuml;hrte &#8211; Dazu ein Ausflug, wof&uuml;r man damals wie heute, diese Rechner kaufte. Supercomputer wurden prim&auml;r f&uuml;r Simulationen eingesetzt. Astronomen berechneten die Vorg&auml;nge im inneren einer Sonne, wie sich aus Planetensimalen Planeten formten. Meteorologen berechneten das Wetter oder Klima, Chemiker die Struktur von Molek&uuml;len und Ingenieure die optimale Form von Tragfl&auml;chen oder was bei einem Crash mit dem Auto passiert.<\/p>\n<p>In den meisten F&auml;llen verl&auml;uft die Simulation so (hier am Beispiel einer Wettervorhersage): Man unterteilt die gesamte Erdoberfl&auml;che in Quadrate (sagen wir mal von 100 x 100 km Kantenl&auml;nge), und die Luft dar&uuml;ber in Schichten (sagen wir mal eine pro 1 km H&ouml;he, insgesamt 16). Nun hat man eine Zelle. F&uuml;r diese berechnet man ausgehend von Ausgangswerten die Temperatur, Luftdruck, Windgeschwindigkeit, Luftfeuchtigkeit etc. Das macht man f&uuml;r jede der in diesem Beispiel 750.000 Zellen. Dann werden Daten ausgetauscht weil Windstr&ouml;mungen und Temperaturunterschiede ja zum Luftaustausch f&uuml;hren und das ganze geht dann weiter, wobei jeder Schritt f&uuml;r ein Zeitintervall steht.<\/p>\n<p>Kurzum: 750.000-mal m&uuml;ssen ein und dieselben Berechnungen durchgef&uuml;hrt werden. Daher ben&ouml;tigt man auch so viel Leistung (bei der Wettervorhersage ist man von den Maschenweiten von 100 km z.B. heute mit mehr Leistung bei einigen Kilometern Maschenweite angekommen, wodurch die Vorhersage genauer und lokal &uuml;berhaupt erst m&ouml;glich ist. Bei 100 km geht selbst der Bodensee als Einflussfaktor weitgehend unter). Das Prinzip findet sich bei vielen Simulationen. Sterne werden in kleine Kuben unterteilt. Das Auto in kleine Dreiecke, bei denen die einwirkenden Kr&auml;fte berechnet werden etc. Alternativ kann man viele K&ouml;rper unabh&auml;ngig berechnen, wie bei Simulationen des Planetensystems oder Molek&uuml;lsimulationen. Auch dann sind aber die Gleichungen f&uuml;r jeden K&ouml;rper identisch.<\/p>\n<p>Der Vektorrrechner ist\u00a0 un daf&uuml;r optimiert. Hinter der Architektur liegt die Erkenntnis, wie langsam normale Mikroprozessoren Zahlen verarbeiten. Das geschieht so f&uuml;r eine Addition:<\/p>\n<ul>\n<li>Lade Variable1 in ein Register<\/li>\n<li>Lade Variable2 in ein zweites Register<\/li>\n<li>Addiere die beiden Register<\/li>\n<li>Speichere das Ergebnis in einer Speicherzelle ab.<\/li>\n<\/ul>\n<p>Das sind vier Maschinenbefehle f&uuml;r eine einzige Operation. Wenn nun praktisch das ganze 750.000 mal gemacht werden muss w&auml;re es viel einfacher, wenn man es effizienter machen k&ouml;nnte. Weiterhin besch&auml;ftigt es unterschiedliche Einheiten in einem Prozessor: Die Ein\/Ausgabeeinheit und die Recheneinheit.<\/p>\n<p>Die Cray 1 hatte nun acht Vektorregister. Jedes enthielt einen Vektor, also ein Feld von Zahlen, im Falle der Cray 1 waren es 64 Zahlen, jede 64 Bit breit. Das Prinzip war nun das einer Pipeline: Eine Einheit f&uuml;llte die die Vektorregister mit Daten, was auch effizienter geht, wenn ein Block aus dem Speicher gelesen werden kann, anstatt jede Speicherzelle einzeln abzufragen und dann wurde je ein Wert aus dem Vektorregister nach einander zur Recheneinheit gef&uuml;hrt. und die Rechnung durchgef&uuml;hrt. Das Vorg&auml;ngermodell von Cray, die CDC 7600, brauchte 9 Takte f&uuml;r eine Rechnung, die Cray 1 nur 9 Takte f&uuml;r die erste und danach einen Takt f&uuml;r jede weitere. Als Folge war die Cray 1 achtmal so schnell wie eine CDC 7600, obgleich der Taktzyklus nur verdoppelt wurde auf 80 MHz. Cray f&uuml;hrte auch die Pipeline ein, d.h. w&auml;hrend die Recheneinheit rechnete konnte die Speichereinheit schon Werte in die Register laden. Da jeder Speicherzugriff mehrere Takte (bis zu 4 dauerte) konnte das Ansto&szlig;en jedes Speicherzugriffs bei jedem Takt auch die Performance erh&ouml;hen. Damit der Speicher &uuml;berhaupt nachkam hatte er den 1 MWort gro&szlig;en Speicher in 16 B&auml;nke aufgeteilt, die nacheinander angesprochen wurden, den das RAM war schon damals langsamer als die Zykluszeit des Rechners.<\/p>\n<p>Zum Erfolg wurde die Cray 1 aber weil sie auch skalare Operationen schnell ausf&uuml;hrte. Die Instruktionen waren sehr einfach aufgebaut, der Computer f&uuml;r damalige Verh&auml;ltnisse sehr zuverl&auml;ssig (eine CDC 7600 beim <a href=\"http:\/\/www.cisl.ucar.edu\/computers\/gallery\/cray\/cray1.jsp\">NCAR<\/a> fiel mindestens einmal, oft 4-5-mal pro Tag aus, eine Cray 1 lief mehrere Tage durch). Die Spitzenperformance war davon abh&auml;ngig wie gut die Programm vektorisierbar waren. werte von 80 &#8211; 136 MFLOPS und 160-240 MIPS werden genannt.<\/p>\n<p>Cray arbeitete auch bei seinen folgenden Rechnern an den Konzept der Vektorrechner, doch nach einem Jahrzehnt wurden die Rechner popul&auml;rer die heute dominieren: massiv parallele Rechner aus vielen handels&uuml;blichen Mikroprozessoren anstatt eigens hergestellten Chips. Je h&ouml;her integriert die Mikroprozessoren wurden, desto leistungsf&auml;higer wurden sie und desto kleiner der Unterschied zu speziellen Vektorprozessoren die nur in kleinen St&uuml;ckzahlen produziert wurden. Nur Japan hielt an diesem Konzept noch lange Zeit fest und brachte 2002 den Earth Simulator heraus, der bis 2004 der schnellste Rechner der Welt war. Er war der letzte mit Vektorprozessoren. Er erreichte mit 5120 Vektorprozessoren 35 Terraflops..<\/p>\n<p>Die Technologie ist inzwischen l&auml;ngst in die Mikroprozessoren eingeflossen, Ohne Pipeline w&auml;ren die Prozessoren nur so schnell wie der Speicher, w&uuml;rden also etwa auf 486er Niveau stehen bleiben. Und auch Vektoroperationen gibt es heute. Bei Mikroprozessoren heisst dasselbe Prinzip SIMD (Single Instruction, Multiple Data). Anstatt 64 Registern setzen aber Mikroprozessoren meist wenige Register ein, die daf&uuml;r sehr lang sind. (bei AVX, der neuesten Entwicklung von AMD und Intel z.B. 256 Bit, wodurch dann vier Zahlen a 64 Bit gleichzeitig bearbeitbar sind). Signalverarbeitungsprozessoren nutzen SIMD wesentlich st&auml;rker als Mikroprozessoren, weil ihre Aufgaben auch sehr gut vektorisierbar sind.<\/p>\n<p>In gewisser Weise sind auch die CPU&#8217;s von Grafikprozessoren Vektoreinheiten. Diese GPU haben sehr einfache Kerne, die anders als Mehrkernprozessoren nicht unabh&auml;ngig arbeiten k&ouml;nnen und meist auch nur die Grundrechenarten beherrschen, aber es sind Hunderte. Man k&ouml;nnte sie daher durchaus mit Vektorprozessoren vergleichen &#8211; jede Einheit steht eben dann f&uuml;r ein Vektorregister. Von der reinen Rechenleistung h&auml;ngen GPU&#8217;s seit mindestens 10 Jahren die CPU&#8217;s deutlich ab. Was ihren Einsatz limitierte war dass sie schwer zu programmieren waren, die Programme nicht sehr lang waren und die Ausrichtung auf Spiele die Genauigkeit auf 32 Bit beschr&auml;nkte (das st&ouml;rt beim Spiel nicht, denn 32 Bit sind immer noch ein vielfaches der Monitoraufl&ouml;sung). Seit ein paar Jahren versuchen NVidea und ATI mit speziellen GPU f&uuml;r Supercomputer die diese Nachteile nicht haben in den Supercomputermarkt einzubrechen und immer mehr Systeme mit gemischter CPU\/GPU Best&uuml;ckung gibt es auch. in der Top 500 Liste. Bestplatziertes ist der Jaguar mit einer Mischbest&uuml;ckung aus Opteron \/ Kepler GPU&#8217;s. Die Mischbest&uuml;ckung wird bleiben, aber ich denke die GPU&#8217;s werden bald den L&ouml;wenanteil stellen. Eine Alternative ist es wie im Intel Xenon Phi den Prozessor aus vollwertigen, aber einfachen Kernen aufzubauen. Intel wollte mal einen GPU &auml;hnlichen Ansatz, hat den aber verworfen und nimmt nun den P54C Kern, das ist f&uuml;r nicht eingeweihte die Pentium Architektur &#8211; nicht gerade ein &#8222;einfacher&#8220; Chip, aber vergleichen mit den heutigen Prozessoren doch recht &uuml;berschaubar mit 3,1 Millionen Transistoren &#8211; heute sind wir jenseits der 1 Milliardengrenze.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Seymour Cray&#8217;s Beitrag zu den Computern war schon als ich mich in den Achtzigern daf&uuml;r interessierte legend&auml;r. Cray war urspr&uuml;nglich bei CDC (Control Data Corporation) f&uuml;r die Entwicklung der CD-6600 und 7600 verantwortlich, den schnellsten Computern ihrer Zeit und auch in ihrer Architektur richtungsweisend. Aber die Entwicklung war teuer und es kam zu Problemen als [&hellip;]<\/p>\n","protected":false},"author":169,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[4],"tags":[2907,2906,2905],"class_list":["post-7096","post","type-post","status-publish","format-standard","hentry","category-computer","tag-cray-1","tag-seymour-cray","tag-vektorrechner","entry"],"a3_pvc":{"activated":false,"total_views":315,"today_views":0},"jetpack_featured_media_url":"","jetpack-related-posts":[{"id":18380,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/09\/03\/die-glorreichen-10-das-war-mal-weg-pc-hardware\/","url_meta":{"origin":7096,"position":0},"title":"Die glorreichen 10 &#8211; Das war mal weg: PC Hardware","author":"Bernd Leitenberger","date":"3. September 2025","format":false,"excerpt":"Ich will heute mal zwei ZDF Info \/ Neo Sendungen verbinden. Die glorreichen 10, die bei mir als Vorlage f\u00fcr einige Blogs dienten und die von mir noch mehr gesch\u00e4tzte Sendung \"Das war mal weg\", wo es um Dinge geht, die fr\u00fcher fast jeder hatte und die heute aus unserem\u2026","rel":"","context":"In &quot;Die Glorreichen 10&quot;","block_context":{"text":"Die Glorreichen 10","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/allgemein\/die-glorreichen-10\/"},"img":{"alt_text":"","src":"https:\/\/vg02.met.vgwort.de\/na\/876c61d389304d98aa0332fadd769381","width":350,"height":200},"classes":[]},{"id":18610,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/27\/galileos-cds-teil-1\/","url_meta":{"origin":7096,"position":1},"title":"Galileos CDS &#8211; Teil 1","author":"Bernd Leitenberger","date":"27. M\u00e4rz 2026","format":false,"excerpt":"Hall\u00f6chen, es wird Zeit das ich mich mal wieder melde. Es gab zwei Gr\u00fcnde, warum ich mich so rar gemacht habe. Das eine ist das es gerade nicht so viel aktuelles gibt, au\u00dfer einem Update zu Artemis, zu dem ich vielleicht noch etwas schreibe. W\u00e4hrend Trump das ganze Programm nach\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/4fb81c7bafbd4d9d88b5695abdb33d29","width":350,"height":200},"classes":[]},{"id":17895,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/01\/19\/nachlese-teststart-starship-itf-7\/","url_meta":{"origin":7096,"position":2},"title":"Nachlese Teststart Starship ITF-7","author":"Bernd Leitenberger","date":"19. Januar 2025","format":false,"excerpt":"Die erste Phase lief noch nach Plan. Das Starship mit der Seriennummer S33 und die SuperHeavy mit der Seriennummer B14 hoben mit 37 Minuten Versp\u00e4tung um 4:37 nachmittags lokaler Zeit ab. Der Flug selbst hatte einen genehmigten Startzeitraum von 10. bis zum 17. Januar 2025 mit jeweils einem Startfenster pro\u2026","rel":"","context":"In &quot;SpaceX&quot;","block_context":{"text":"SpaceX","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/spacex\/"},"img":{"alt_text":"","src":"https:\/\/vg06.met.vgwort.de\/na\/60231369830445f0b5712ad7af8fdc7a","width":350,"height":200},"classes":[]},{"id":18614,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/29\/galileos-cds-teil-3\/","url_meta":{"origin":7096,"position":3},"title":"Galileos CDS &#8211; Teil 3","author":"Bernd Leitenberger","date":"29. M\u00e4rz 2026","format":false,"excerpt":"So nun zum dritten Teil \u00fcber das prim\u00e4re Computersystem von Galileo, das CDS. Nachdem sich die ersten beiden Teile nur mit dem RCA 1802, warum er gew\u00e4hlt wurde und seiner Architektur befassten geht es heute um das Computersystem selbst. Der Artikel schlie\u00dft so an seine beiden Vorg\u00e4nger gestern und vorgestern\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/6e7f572a246b4ac395de9c260733b707","width":350,"height":200},"classes":[]},{"id":18612,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/28\/galileos-cds-teil-2\/","url_meta":{"origin":7096,"position":4},"title":"Galileos CDS \u2013 Teil 2","author":"Bernd Leitenberger","date":"28. M\u00e4rz 2026","format":false,"excerpt":"So, heute geht es weiter mit Teil 2 \u00fcber Galileos CDS, dieser Beitrag schlie\u00dft nahtlos an den ersten Beitrag von gestern an, wie man schon an der ersten Textzeile sieht. Nach der Einleitung im ersten Teil geht es heute weiter damit warum der RCA 1802 genutzt wurde und was seine\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/191e4b0728de42829cf656027b84dc82","width":350,"height":200},"classes":[]},{"id":15629,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2021\/12\/07\/der-koenig-der-coverversionen\/","url_meta":{"origin":7096,"position":5},"title":"Der K&ouml;nig der Coverversionen","author":"Bernd Leitenberger","date":"7. Dezember 2021","format":false,"excerpt":"Cover sind beliebt. Viele Interpreten, auch durchaus K\u00fcnstler mit eigenen ber\u00fchmten Songs haben ihre ersten Platten mit Covern gef\u00fcllt, so die Beatles. Andere versuchen sich auf der Spitze ihres Erfolges in Neuauflagen wie Bowie\/Jagger an Dancing in the Street und wenn es gut l\u00e4uft, ist das Cover erfolgreicher als alle\u2026","rel":"","context":"In &quot;Allgemein&quot;","block_context":{"text":"Allgemein","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/allgemein\/"},"img":{"alt_text":"","src":"https:\/\/vg02.met.vgwort.de\/na\/3a82449d144d41f6b2a3a633a1ec60c0","width":350,"height":200},"classes":[]}],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/7096","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/users\/169"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/comments?post=7096"}],"version-history":[{"count":0,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/7096\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/media?parent=7096"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/categories?post=7096"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/tags?post=7096"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}