{"id":7516,"date":"2013-01-19T00:24:48","date_gmt":"2013-01-18T23:24:48","guid":{"rendered":"http:\/\/www.bernd-leitenberger.de\/blog\/?p=7516"},"modified":"2013-01-19T09:38:08","modified_gmt":"2013-01-19T08:38:08","slug":"ich-mochte-einen-xeon-phi","status":"publish","type":"post","link":"https:\/\/www.bernd-leitenberger.de\/blog\/2013\/01\/19\/ich-mochte-einen-xeon-phi\/","title":{"rendered":"Ich m&ouml;chte einen Xeon Phi"},"content":{"rendered":"<p>Schon in meinen ersten Computerjahren, so Anfang \/ Mitte der achtziger faszinierten mich Supercomputer. Diese Rechenpower auf kleinstem Raum, die hochgez&uuml;chtete Elektronik, wie bei der Cray die superschnelle ECL Logik. Inzwischen haben Supercomputer viel Sex-Appeal verloren. Einige Tausend bis einige Zehntausend PC&#8217;s miteinander koppeln kann jeder, okay es sind keine PC&#8217;s, sondern Server aber im Prinzip Standard PC Technik. Anstatt einem kompakten Rechner wie der Cray 1, die man notfalls auch als Couch nutzen konnte, f&uuml;llen heute Supercomputer ganze Hallen und verbrauchen Megawatt an Strom. F&uuml;r den Earth-Simulator hat man sogar extra ein Geb&auml;ude, samt Kraftwerk nebenan, f&uuml;r die Stromversorgung gebaut.<!--more--><\/p>\n<p>Trotzdem ist es absolut gesehen ein kleiner Markt, verglichen mit den Zig-Millionen von Servern bei Internet Providern, Webhostern, in Firmen oder gar bei Google und Amazon. spezialisierte Hardware ist weitgehend ausgestorben, selbst Cray produziert seit Mitte der neunziger Jahre Rechner auf Basis von Standardprozessoren. Eigenes Know-How steckt nat&uuml;rlich noch drin und zwar in der Verbindung der Knoten und deren Kommunikation.<\/p>\n<p>Trotzdem scheint dieser Markt so interessant zu sein, dass man Spezialhardware daf&uuml;r entwickelt. Nvidea und ATI entwickeln eigene Grafikkarten die als GPU&#8217;s eingesetzt werden. Rein theoretisch haben die Grafikprozessoren (GPU) eine viel h&ouml;her Rechenleistung als CPU&#8217;s. Einfach weil es derer viel mehr sind. Die Grabbeltischkarten haben schon 64 bis 128 Recheneinheiten, die nun f&uuml;r Supercomputer vorgesehenen von Nvidea und ATI haben 2496 bzw. 2048 Kerne. Der Unterschied zu den f&uuml;r Spiele gedachten Karten ist dann aber schon gegeben. Bei einem Spiel ist es notwendig Szenen zu berechnen. Da reicht die einfache Genauigkeit v&ouml;llig aus, eventuell sogar nur das Rechnen mit Integerzahlen. Dagegen braucht man bei wissenschaftlichen Berechnungen double precision. Viel gr&ouml;&szlig;ere Umstellungen erforderten die Programme. Zum einen von dem M&ouml;glichkeiten der Kerne her sie zu programmieren &#8211; es geht ja nicht nur um Berechnungen sondern auch Programmstrukturen. Auch der Speicher musste erheblich vergr&ouml;&szlig;ert werden. F&uuml;r den Einsatz als Grafikkarte sind das zwar nette &#8222;nice to have&#8220; Features, doch wird alleine schon wegen der einheitlichen DirectX Schnittstelle. Spiele werden sicher nicht jedes Feature ausnutzen k&ouml;nnen, aber sich skalieren sie besser mit mehr Kernen als mit komplexeren Programmen.<\/p>\n<p>So gesehen verwundert es dass Nvidea und ATI sich auch auf diesen Markt konzentrieren. Aber sie sind nicht die Einzigen. Auch Intel arbeitet seit 10 Jahren fast nur noch an der Verbesserung der Flie&szlig;kommaperformance, vor allem aber &uuml;ber spezielle Erweiterungen. Da gab es zuerst MMX, bei der die Flie&szlig;kommaeinheit mehrere Integerzahlen gleichzeitig manipulierte, dann SSE bei der das zuerst mit mehreren Single Precission Variablen klappte, nun &uuml;ber einige SSE Generationen weiter sind wir bei AVX mit 256 Bit Registern.<\/p>\n<p>Nur: normale Programme nutzen das nicht. Zum einen sind Anwendungen die Flie&szlig;kommabefehle massiv nutzen bei PC-Programmen d&uuml;nn ges&auml;t, so viel zu Rechnen gibts nicht. Selbst bei Bildbearbeitung kommt man oft mit Integers aus, die &uuml;blichen Verd&auml;chten beschr&auml;nken sich meist auf den ber&uuml;hmten &#8222;Gaussschen Verwischer&#8220; und das Encodieren von Video. Bei den vielen Servern im Einsatz ist es fast noch wichtiger, dass die Datenrate stimmt. Entweder bei der &Uuml;bertragung von Daten &uuml;ber das Netz oder von Festplatten. Viel gerechnet wird da nicht. Eine zweite Einschr&auml;nkung ist, das Programme auf allen Rechnern laufen sollen, auch solchen ohne SSE(x) und auf allen Betriebssystemen (AVX ben&ouml;tigt z.b. Windows 7 oder 8 in der Windows Linie). Kein Hersteller der Welt baut CPU-Befehle ein die nur bei bestimmten Rechnern laufen, weil er sich dann schon denken kann wie viele Supportanfragen er beantworten kann.<\/p>\n<p>Was dem Nutzer wohl mehr nutzt sind viele einfache Kerne oder noch besser mehr Takt. Nun dem letzten sind physikalische Grenzen gesetzt, aber das erste kann man noch steigern. Nun gibt es von Intel f&uuml;r das Hochleistungsrechnen (High-Perfromance Computing) den Xeon Phi &#8211; wie eine Grafikkarte auf einer Steckkarte mit eigenem Speicher. Doch es handelt sich um einen Prozessor aus 60 P54C Kernen &#8211; P54c, das ist das Pentium Design, das Intel wieder von der NASA zur&uuml;ckgekauft hatte, nachdem sie es vor einigen Jahren mal abtrat. Die NASA wollte daraus strahlengeh&auml;rtete Prozessoren machen und das war keine schlechte Idee, denn das Pentium Design ist relativ schn&ouml;rkellos, eine effektive Br&uuml;cke zwischen x86 Codes und interner RISC Verarbeitung. Er hat eben nur eine FPU und eine ALU. Nicht wie heute mehrere pro Kern. Das vereinfacht die Programmierung und Auslastung und es gibt kein MMX, kein SSE und kein AVX. Trotzdem erreicht ein Xeon Phi (fr&uuml;herer Projektname: Larrabee) eine Spitzenleistung von 1,01 TFlops bei Double Precission.<\/p>\n<p>Die Frage ist: Warum nicht das ganze f&uuml;r den Desktop? Warum muss ich f&uuml;r Erweiterungen zahlen die die CPU verteuern und mir nichts bringen? Ein Xeon Phi hat 5 Milliarden Transistoren bei 60 Kernen, also 80 Millionen pro Kern. Eine ICore I3\/I5 also Mittelklasse CPU 497 Millionen Transistoren f&uuml;r 2-4 CPU Kerne, also im besseren Falle 124 Millionen pro CPU. Mir w&auml;ren mehr einfache CPU Kerne lieber, also 3\/6 anstatt mehr Funktionseinheiten die mir nichts n&uuml;tzen. Irgendwie bringt es Intel nicht so richtig hin. Entweder sie sparen am falschen Ende (Atom ohne Umsortierung der Befehle, was ihn drastisch verlangsamt) oder sie bauen was ein, das keiner braucht. Ich w&uuml;rde sogar noch weiter gehen &#8211; vielleicht braucht nicht jeder Kern eine GFPU. Vielleicht reicht auch f&uuml;r jeden zweiten eine.<\/p>\n<p>Also Intel &#8211; baut eine Billgversion des Xeon Phi, als Desktop Prozessor.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Schon in meinen ersten Computerjahren, so Anfang \/ Mitte der achtziger faszinierten mich Supercomputer. Diese Rechenpower auf kleinstem Raum, die hochgez&uuml;chtete Elektronik, wie bei der Cray die superschnelle ECL Logik. Inzwischen haben Supercomputer viel Sex-Appeal verloren. Einige Tausend bis einige Zehntausend PC&#8217;s miteinander koppeln kann jeder, okay es sind keine PC&#8217;s, sondern Server aber im [&hellip;]<\/p>\n","protected":false},"author":169,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[4],"tags":[610,192,3039],"class_list":["post-7516","post","type-post","status-publish","format-standard","hentry","category-computer","tag-grafikkarten","tag-intel","tag-xeon-phi","entry"],"a3_pvc":{"activated":false,"total_views":568,"today_views":0},"jetpack_featured_media_url":"","jetpack-related-posts":[{"id":18524,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/02\/06\/elon-musks-ki-rechenzentren-im-orbit-nochmals-nachgerechnet\/","url_meta":{"origin":7516,"position":0},"title":"Elon Musks KI-Rechenzentren im Orbit &#8211; nochmals nachgerechnet","author":"Bernd Leitenberger","date":"6. Februar 2026","format":false,"excerpt":"Ich habe mich ja schon mal mit diesem Thema besch\u00e4ftigt, in dem es vor allem um die Kosten und den wirtschaftlichen Unsinn ging - warum sollte ich ein Rechenzentrum in den Orbit bringen, wenn ich es billiger auf der Erde bauen kann und es auch gen\u00fcgend Gegenden gibt in denen\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg06.met.vgwort.de\/na\/78014052fde04012a2be60bd108cd4bb","width":350,"height":200},"classes":[]},{"id":18659,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/05\/14\/vor-dem-12-ten-testflug-des-starships-ift-12\/","url_meta":{"origin":7516,"position":1},"title":"Vor dem 12-ten Testflug des Starships IFT-12 &#8211; eine Analyse","author":"Bernd Leitenberger","date":"14. Mai 2026","format":false,"excerpt":"Ich habe ja schon was dazu geschrieben, nun ist der Start angek\u00fcndigt f\u00fcr den 19.5.2026 um 5:30 pm ct, das m\u00fcsste, wenn ich richtig gerechnet habe, um 0:30 am 20.5.2026 bei uns sein. Hier mal eine kurze Zusammenfassung was man bisher vom Test wei\u00df. Zuerst einmal das bekannte \u2013 der\u2026","rel":"","context":"In &quot;SpaceX&quot;","block_context":{"text":"SpaceX","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/spacex\/"},"img":{"alt_text":"","src":"https:\/\/vg06.met.vgwort.de\/na\/f3d312214e7d4d02863261daf339c7e0","width":350,"height":200},"classes":[]},{"id":18683,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2026\/06\/01\/die-glorreichen-10-programmiersprachen-2\/","url_meta":{"origin":7516,"position":2},"title":"Die glorreichen 10 \u2013 Programmiersprachen (2)","author":"Bernd Leitenberger","date":"1. Juni 2026","format":false,"excerpt":"Der heutige Teil schlie\u00dft nahtlos an den ersten Teil an, der gestern erschien. Es geht um 10 Kriterien anhand derer man Programmiersprachen kategorisieren kann. Maschinennah oder universell, aber komplex Als eine maschinennahe Sprache bezeichnet man eine Sprache, die nahe den M\u00f6glichkeiten von Prozessoren ist. Das Paradebeispiel ist C. Alle Prozessoren\u2026","rel":"","context":"In &quot;Die Glorreichen 10&quot;","block_context":{"text":"Die Glorreichen 10","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/allgemein\/die-glorreichen-10\/"},"img":{"alt_text":"","src":"https:\/\/vg09.met.vgwort.de\/na\/7f5d9cf5265047179df05b778bf455b5","width":350,"height":200},"classes":[]},{"id":5216,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2011\/08\/10\/fcea2\/","url_meta":{"origin":7516,"position":3},"title":"FCEA2","author":"Bernd Leitenberger","date":"10. August 2011","format":false,"excerpt":"CEA2 (Chemical Equilibrium with Applications) ist ein seit gut 30 Jahren entwickeltes NASA Programm mit dem verschiedenste Probleme bei Gasphasen berechnet werden k\u00f6nnen. Ich beschr\u00e4nke mich auf das, was Raumfahrtliebhaber wohl am meisten machen: Die Berechnung der Performance von Triebwerken bei Raketen. Ich will die Benutzung des Programmes einmal erl\u00e4utern,\u2026","rel":"","context":"In &quot;Raumfahrt&quot;","block_context":{"text":"Raumfahrt","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/"},"img":{"alt_text":"","src":"https:\/\/vg01.met.vgwort.de\/na\/89efc24160614a1a93d97d19447e81a6","width":350,"height":200},"classes":[]},{"id":4557,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2011\/04\/03\/atom-und-wahlnachlese\/","url_meta":{"origin":7516,"position":4},"title":"Atom- und Wahlnachlese","author":"Bernd Leitenberger","date":"3. April 2011","format":false,"excerpt":"Nun einige Wochen nach dem Super-Gau von Japan wird es an der Zeit f?r eine Nachlese und zwar eine etwas allgemeiner gehaltene. Ich m?chte an dieser Stelle mal meine Einstellung zur Kernkraft in den letzten Jahrzehnten reflektieren. Ich war urspr?nglich f?r Kernkraft. Wie viele andere, glaubte ich an umweltfreundliche Energie\u2026","rel":"","context":"In &quot;Allgemein&quot;","block_context":{"text":"Allgemein","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/allgemein\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":17895,"url":"https:\/\/www.bernd-leitenberger.de\/blog\/2025\/01\/19\/nachlese-teststart-starship-itf-7\/","url_meta":{"origin":7516,"position":5},"title":"Nachlese Teststart Starship ITF-7","author":"Bernd Leitenberger","date":"19. Januar 2025","format":false,"excerpt":"Die erste Phase lief noch nach Plan. Das Starship mit der Seriennummer S33 und die SuperHeavy mit der Seriennummer B14 hoben mit 37 Minuten Versp\u00e4tung um 4:37 nachmittags lokaler Zeit ab. Der Flug selbst hatte einen genehmigten Startzeitraum von 10. bis zum 17. Januar 2025 mit jeweils einem Startfenster pro\u2026","rel":"","context":"In &quot;SpaceX&quot;","block_context":{"text":"SpaceX","link":"https:\/\/www.bernd-leitenberger.de\/blog\/category\/raumfahrt\/spacex\/"},"img":{"alt_text":"","src":"https:\/\/vg06.met.vgwort.de\/na\/60231369830445f0b5712ad7af8fdc7a","width":350,"height":200},"classes":[]}],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/7516","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/users\/169"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/comments?post=7516"}],"version-history":[{"count":0,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/posts\/7516\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/media?parent=7516"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/categories?post=7516"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bernd-leitenberger.de\/blog\/wp-json\/wp\/v2\/tags?post=7516"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}