{"id":10234,"date":"2014-06-29T00:01:36","date_gmt":"2014-06-28T22:01:36","guid":{"rendered":"http:\/\/www.bernd-leitenberger.de\/blog\/?p=10234"},"modified":"2014-06-28T18:44:40","modified_gmt":"2014-06-28T16:44:40","slug":"crays-fehler","status":"publish","type":"post","link":"https:\/\/www.bernd-leitenberger.de\/blog\/2014\/06\/29\/crays-fehler\/","title":{"rendered":"Crays Fehler"},"content":{"rendered":"<p>Seymour Cray gilt als der Vater der Supercomputer. Beginnend mit der CDC 6600, die 1964 erschien, waren Rechner die er (mit)konstruiert hatte &uuml;ber 30 Jahre die schnellsten der Welt. Doch bei dieser Leistung hatte er auch einige kapitale Fehlurteile. Die meisten f&uuml;hren sicher als erstes das Scheitern bei der CDC 8600 an. Schon bei der CDC 6600 war ein Problem, dass am Ende der Schr&auml;nke die Signallaufzeiten St&ouml;rungen auf den Leitungen verursachten weil Signale unterschiedlich stark verz&ouml;gert wurden und so schon auf einer schnellen direkten Verbindung das n&auml;chste Taktsignal anlag. Die CDC 6600 lief nur mit 10 MHz, was immerhin noch Kabell&auml;ngen von bis zu 20 m erlaubte. Die CDC 8600 arbeitete bei 125 MHz, wodurch die Packung extrem dicht sein musste, Kabel mussten nun sehr kurz sein. Cray bekam die K&uuml;hlung nicht in den Griff, die durch die schnellen aber sehr energiehungrigen ECL Schaltungen freigesetzt wurde. Er brach das Projekt ab und gr&uuml;ndete seine eigene Firma. Das Mockup der 8600 sieht &uuml;brigens aus wir eine Kreuzung der folgenden Cray Rechner. Die Bank der Cray 1 und die kleine Zentraleinheit der Cray 2. Ich halte es nicht f&uuml;r einen Fehler, denn der Rechner war einfach f&uuml;r seine Zeit zu ambitioniert. Das K&uuml;hlungsproblem dieser Packungsdichte sollte Cray erst mehr als ein Jahrzehnt sp&auml;ter bei der Cray 2 l&ouml;sen. Selbst der unmittelbare Nachfolger die Cray 1 war langsamer und gr&ouml;&szlig;er.<!--more--><\/p>\n<p>Dir Cray 1 war zwar um einiges schneller als die CDC 7600 und ein Verkaufsschlager, aber sie hatte im Design drei M&auml;nge,l von denen er den gravierendsten nie behob. Der erste, kleine, Mangel waren zwei fehlende Maschinenbefehle die anscheinend f&uuml;r viele FORTAN Programme ben&ouml;tigt wurden und zwar f&uuml;r Anweisungen in der Form:<\/p>\n<p>Y[i]=X[Index[i]]<br \/>\nY[Index[I]]=X[i]<\/p>\n<p>Also die Nutzung eines Array Elementes als Index. Das nannte sich im damaligen Sprachgebrauch Scatter\/Gather, ich kenne es als indirekte Adressierung. Das konnte man relativ einfach bei der Cray X-MP nachreichen. Das zweite war das I\/O Subsystem. Die Cray 1 hatte zur Kommunikation mit der Au&szlig;enwelt nichts anderes als 12 Kan&auml;le mit je 16 Leitungen und drei Handshakeleitungen. &Uuml;ber jeden Kanal konnten 320 MBit\/s &uuml;bertragen werden. Das dumme nur: Solange das stattfand war die CPU besch&auml;ftigt. Es fehlte ein System, das sich nur um die Ein\/Ausgabe k&uuml;mmerte und die Daten zwischenspeicherte. Das wurde bei der Cray 1S nachgeliefert, als erstes der drei Probleme, weil die unzureichenden I\/O M&ouml;glichkeiten offensichtlich waren. (Anders als alle vorherigen Computer war die Cray 1 auch nicht vollst&auml;ndig &#8211; man brauchte einen eigenen Computer um sie &uuml;berhaupt zu starten und mit ihr zu kommunizieren). Interessanterweise hat Cray 1 bei seinem ersten Supercomputer der CDC 6600 eigens 10 I\/O Prozessoren vorgesehen um die CPU zu entlasten. Unverst&auml;ndlich, warum er bei der Cray 1 darauf verzichtete, denn die Cray 1S bekam dann ein analoges System verpasst.<\/p>\n<p>Der Hauptmangel denn er auch nicht bei der Cray 2 und Cray 3 behob war die mangelnde Speicherbandbreite. Die Cray 1 konnte pro Taktzyklus 4 Instruktionen aber nur 1 Datenwort lesen. Das war bei den Daten viel zu wenig, denn bei Vektoroperationen konnte in einem Takt ein Ergebnis pro Funktionseinheit geliefert werden. Das entsprach beim Verketten von Rechnungen zwei Lese und einem Schreibzugriff. Die Cray 1 war ausgelegt auf Register-\/Registeroprerationen, hatte deswegen auch die Vektorregister mit 64 Eintr&auml;gen. Doch auch diese mussten gef&uuml;llt werden und bei einem Wort pro Takt war es so dass eine Vektoroperation in 72 Takten erledigt war, das f&uuml;llen eines Registers aber 81 Takte erforderte. Das war mit ein Grund warum die Cray 1 in vielen Programmen ziemlich einbrach, selbst bei Vektoroperationen, es musste nur mehr als 64 Elemente sein. Bei der Cray X-MP, die Steven Chen als Firmeninterne Konkurrenz aus der Cray 1 entwickelte lernte man daraus und vervierfachte die Speicherbandbreite es gab dort pro Takt je zwei Lesezugriffe, einen Schreibzugriff und einen I\/O Zugriff. Andere Rechner wie die Cyber 205 hatten von Anfang an breite Datenbusse, bei dieser z.B. 512 Bit breit, was 8 Datenworten auf einmal entsprach. Auch andere Techniken um dem langsamen Speicher zu begegnen wie Caches setzte Cray nicht ein. Er f&uuml;hrte bei der Cray 2 einen lokalen Speicher ein, doch der wurde durch befehle gef&uuml;llt und pufferte nicht Daten aus dem Arbeitsspeicher ab. Bei der Cray 2 machte er zudem den Fehler vom einen Extrem (Bipolar-Speicher mit niedriger Integrationsdichte aber kurzer Zugriffszeit) aufs andere Extrem (DRAM Speicher mit hoher Integrationsdichte aber schlechter Zugriffszeit) zu wechseln. Die Folge: der Rechner erreichte selbst in spezialisierten Benchmarks selten mehr als 50% seiner nominellen Leistung. Auch f&uuml;r Vektorregister ideal, w&auml;re ein Burstzugriff, der die 64 Register &uuml;ber die 53 B&auml;nke gleichzeitig f&uuml;llt und so gerade bei einem sso registerorientierten Rechner Geschwindigkeit bringt.<\/p>\n<p>Die Cray 3 setzte dann auf Galliumarsenid, ob man das als Fehlentscheidung sieht h&auml;ngt wohl mehr vom Standpunkt ab. Aus der Hardwaresicht war es so, dass Crays Rechner niedrig integriert waren. Die Cray 2 hatte z.b. nur 16 Gatter pro Chip. Gallumarsenid war bei so wenigen Elementen dann eine Alternative, die schneller war. Der Grundfehler den man Cray ankreiden muss ist aber dass er von der Grundarchitektur nicht ablie&szlig;. er setzte nach wie vor auf wenige Prozessoren, auf ECL Technologie. Er erweiterte auch nicht die interne Architektur. Die 8 normalen, 8 Adressregister und 8 Vektorregister (mit je 64 Elementen) blieben bei jeder Generation. Es gab auch immer die gleichen Funktionseinheiten, sie wurden eher weniger wenn man durch h&ouml;here Integration zwei zusammenfassen konnte. Sie zu verdoppeln kam nicht in Frage, dabei taten dies als die Cray 3 erschien, schon Mikroprozessoren.<\/p>\n<p>Eigentlich muss Cray das Problem bekannt gewesen sein. Als die Cray 1 erschien hatte sie einen Takt von 80 MHz, Mikroprozessoren lagen damals bei 3 MHz. Bis zur Cray 3 wurde der Takt auf 500 MHz gesteigert &#8211; der Faktor 6. Mikroprozessoren erreichten als die Cray 3 erschien 66 MHz, waren also um den Faktor 22 schneller geworden und in der Verarbeitung von Daten hatten sie enorm aufgeholt: Von 8 Bits auf 32 Bits auf einmal und Flie&szlig;kommabefehle gab es nun auch. Ein Mikroprozessor war nun noch nicht so schnell wie eine Cray, aber er hatte enorm an Rechenleistung aufgeholt. In MFLOPS ausgedr&uuml;ckt von 0,004 auf 1-2. W&uuml;rde diese Entwicklung weiter gehen (und sie beschleunigte sich sogar im folgenden Jahrzehnt) so w&uuml;rden sie bald die Rechner die aus tausenden von Chips bestanden und die man nicht mehr kleiner bauen konnte, weil bei 500 MHz (Takt der Cray 3) keine Leitung l&auml;nger als 40 cm sein d&uuml;rfte und die Rechner so enorm hoch integriert waren und im K&uuml;hlmittel badeten &uuml;berholen.<\/p>\n<p>In einem gewissen Sinne war Cray enorm konservativ, er hat im Prinzip die Architektur &uuml;ber 20 Jahre nicht ge&auml;ndert. Er versuchte nur mehr Geschwindigkeit durch schnellere Schaltungen, h&ouml;here Packung und zum Schluss ein anderes Halbleitermaterial zu erreichen. Das denke ich ist sein gr&ouml;&szlig;ter Fehler. wer stehenbleibt verliert den Anschluss.<img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/vg03.met.vgwort.de\/na\/c84a3a597da0443398879e557123bcbe\" width=\"1\" height=\"1\" alt=\"\"\/><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Seymour Cray gilt als der Vater der Supercomputer. Beginnend mit der CDC 6600, die 1964 erschien, waren Rechner die er (mit)konstruiert hatte &uuml;ber 30 Jahre die schnellsten der Welt. Doch bei dieser Leistung hatte er auch einige kapitale Fehlurteile. Die meisten f&uuml;hren sicher als erstes das Scheitern bei der CDC 8600 an. Schon bei der [&hellip;]<\/p>\n","protected":false},"author":169,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[4],"tags":[1312,2906,1310],"class_list":["post-10234","post","type-post","status-publish","format-standard","hentry","category-computer","tag-cray","tag-seymour-cray","tag-supercomputer","entry"],"a3_pvc":{"activated":false,"total_views":1767,"today_views":0},"jetpack_featured_media_url":"","jetpack-related-posts":[{"id":18380,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/09\/03\/die-glorreichen-10-das-war-mal-weg-pc-hardware\/","url_meta":{"origin":10234,"position":0},"title":"Die glorreichen 10 &#8211; Das war mal weg: PC Hardware","author":"Bernd Leitenberger","date":"3. September 2025","format":false,"excerpt":"Ich will heute mal zwei ZDF Info \/ Neo Sendungen verbinden. Die glorreichen 10, die bei mir als Vorlage f\u00fcr einige Blogs dienten und die von mir noch mehr gesch\u00e4tzte Sendung \"Das war mal weg\", wo es um Dinge geht, die fr\u00fcher fast jeder hatte und die heute aus unserem\u2026","rel":"","context":"In &quot;Die Glorreichen 10&quot;","block_context":{"text":"Die Glorreichen 10","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/allgemein\/die-glorreichen-10\/"},"img":{"alt_text":"","src":"https:\/\/vg02.met.vgwort.de\/na\/876c61d389304d98aa0332fadd769381","width":350,"height":200},"classes":[]},{"id":18612,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/28\/galileos-cds-teil-2\/","url_meta":{"origin":10234,"position":1},"title":"Galileos CDS \u2013 Teil 2","author":"Bernd Leitenberger","date":"28. M\u00e4rz 2026","format":false,"excerpt":"So, heute geht es weiter mit Teil 2 \u00fcber Galileos CDS, dieser Beitrag schlie\u00dft nahtlos an den ersten Beitrag von gestern an, wie man schon an der ersten Textzeile sieht. Nach der Einleitung im ersten Teil geht es heute weiter damit warum der RCA 1802 genutzt wurde und was seine\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/191e4b0728de42829cf656027b84dc82","width":350,"height":200},"classes":[]},{"id":18614,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/03\/29\/galileos-cds-teil-3\/","url_meta":{"origin":10234,"position":2},"title":"Galileos CDS &#8211; Teil 3","author":"Bernd Leitenberger","date":"29. M\u00e4rz 2026","format":false,"excerpt":"So nun zum dritten Teil \u00fcber das prim\u00e4re Computersystem von Galileo, das CDS. Nachdem sich die ersten beiden Teile nur mit dem RCA 1802, warum er gew\u00e4hlt wurde und seiner Architektur befassten geht es heute um das Computersystem selbst. Der Artikel schlie\u00dft so an seine beiden Vorg\u00e4nger gestern und vorgestern\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg07.met.vgwort.de\/na\/6e7f572a246b4ac395de9c260733b707","width":350,"height":200},"classes":[]},{"id":18485,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/01\/13\/programm-437\/","url_meta":{"origin":10234,"position":3},"title":"Programm 437","author":"Bernd Leitenberger","date":"13. Januar 2026","format":false,"excerpt":"Ich wei\u00df, ich mache mich in den letzten Wochen etwas rar. Daf\u00fcr gibt es zwei Gr\u00fcnde. Da ist zum einen die gesamte politische Lage. Prim\u00e4r nat\u00fcrlich in dem Land des unbegrenzten Irrsinns. Wenn der Machthaber von Venezuela entf\u00fchrt wird und unter falscher Begr\u00fcndung angeklagt wird - weil es ja in\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg06.met.vgwort.de\/na\/3d6eb16326d743baa56f5ece884b5d21","width":350,"height":200},"classes":[]},{"id":16031,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2022\/08\/15\/nicht-so-tasty\/","url_meta":{"origin":10234,"position":4},"title":"Nicht so Tasty","author":"Bernd Leitenberger","date":"15. August 2022","format":false,"excerpt":"Letzte Woche gab es von der Aldi Marke \u201eMucci\u201c die energiereduzierten Eisvariationen der Marke \u201eLess & Tasty\u201c im Angebot. Regul\u00e4r kostet ein Becher von 500 ml 2,89 Euro und damit erheblich mehr als das normale Eis der Eigenmarke \u201eMucci\u201c. Ich habe mir mal zwei Becher gekauft und zwar \u201eWalnuss Vanille\u201c\u2026","rel":"","context":"In &quot;Ern\u00e4hrung&quot;","block_context":{"text":"Ern\u00e4hrung","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/ernaehrung\/"},"img":{"alt_text":"","src":"https:\/\/vg05.met.vgwort.de\/na\/f94905129aca445eb5f4b5305dd72217","width":350,"height":200},"classes":[]},{"id":17895,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/01\/19\/nachlese-teststart-starship-itf-7\/","url_meta":{"origin":10234,"position":5},"title":"Nachlese Teststart Starship ITF-7","author":"Bernd Leitenberger","date":"19. Januar 2025","format":false,"excerpt":"Die erste Phase lief noch nach Plan. Das Starship mit der Seriennummer S33 und die SuperHeavy mit der Seriennummer B14 hoben mit 37 Minuten Versp\u00e4tung um 4:37 nachmittags lokaler Zeit ab. Der Flug selbst hatte einen genehmigten Startzeitraum von 10. bis zum 17. Januar 2025 mit jeweils einem Startfenster pro\u2026","rel":"","context":"In &quot;SpaceX&quot;","block_context":{"text":"SpaceX","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/spacex\/"},"img":{"alt_text":"","src":"https:\/\/vg06.met.vgwort.de\/na\/60231369830445f0b5712ad7af8fdc7a","width":350,"height":200},"classes":[]}],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/10234","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/users\/169"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/comments?post=10234"}],"version-history":[{"count":0,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/10234\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/media?parent=10234"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/categories?post=10234"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/tags?post=10234"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}