Die binomische Formel

Loading

Auf das heutige Thema bin ich gekommen, weil ich in letzter Zeit immer Kaugummis auf dem Weg zum und vom Schwimmen mitnehme. Es sind immer vier Stück, weil ich jeweils zwei auf einmal esse, einer ist mir einfach zu wenig. Es sind immer zwei Pfefferminz- und zwei Spearmint (auf deutsch echte Minze) Kaugummis. Ich greife in die Tasche und bekomme so wahllos zwei Stück. Es sind meistens je ein Spearmint- und ein Pfefferminzkaugummi. Warum dem so ist hängt an der binomischen Formel, also dem heutigen Titelthema.

Ich denke jeder hat die binomischen Formeln mal in der Schule gehabt es gibt ja drei: (a+b)², (a-b)² und (a+b)*(a-b). Ich hatte sie sogar dreimal in der schule, allerdings nicht weil ich sitzenblieb sondern weil mein erster Schulabschluss die Hauptschule war und ich die anderen beiden Abschlüsse dann nachmachte und da kamen sie jeweils am Anfang nochmal im Mathematikunterricht, wohl damit alle Schüler die bei den weiterbildenden Schulen ja von verschiedenen anderen Schulen kamen, das gleiche Einstiegsniveau hatten. Uns interessiert hier nur eine nämlich:

(a+b)n = x

In der Schule hat man nur den Fall für n=2 durchgekaut, dafür aber viel zu lange. Mit der Formel für beliebige n kann man nämlich Statistik betrieben. Es ist die Lösung für ein Problem der Statistik:

Es soll zwei Fälle geben mit Wahrscheinlichkeiten a und b. Normiert man, damit man später die Prozentualen Wahrscheinlichkeiten direkt durch die Formel bekommt, so gilt a+b=1. Zieht man n mal durch Zufall Proben wobei jede Probe unabhängig von der anderen ist, also bei jedem Zug entweder Fall 1 oder Fall 2 mit den Wahrscheinlichkeiten a und b auftreten kann, so liefert die binomische Formel die Verteilung der entstehenden Proben.

Also zu meinen Kaugummis zurück. Im idealen fall, der leider nicht in meiner Hosentasche vorliegt, gäbe es unendlich viele Kaugummis (oder wenn es nur vier sind, so wird beim Entnehmen eines Kaugummis durch wundersame Fügung wieder genau der gleiche neu in der Hosentasche erscheinen) würde ich für zwei gezogene Kaugummis die Schulformel anwenden können:

(a+b)² = 1*a² + 2*ab + 1*b²

Im Ergebnis sagt die Potenz von a und b aus wie viele Kaugummis jeder Sorte man bekommt und die Multiplikatoren wie häufig der Fall ist, also wenn ich für a=0,5 und b=0,5 (gleiche Wahrscheinlichkeiten) setze und jedes a mit einem Pfefferminz und jedes b mit einem Spearminzkaugummi gleichsetz,e so ist die Verteilung:

1 x 2 Pfefferminz + 2 x je ein Pfefferminz und ein Spearminz + 1 x zwei Speaminz

Eingesetzt a=0,5 und b= 0,5 kommt man auf:

0,5² + 2 x 0,5*0,5 + 0,5² = 1

Ausgerechnet:

0,25 (a²) + 0,5 (ab) + 0,25 (b²)

Es ist also doppelt so wahrscheinlich zwei unterschiedliche Kaufgummis zu bekommen als je zwei Pfeffer- oder Spearmintkaugummis. Das liegt daran das wenn zwei Pfefferminz vorliegen sollen, der erste und der zweite Kaugummi ein Pfefferminz sein muss. Bei dem gemischten Fall kann aber der erste ein Pfefferminz und der zweite gezogene ein Spearmint sein oder der erste ein Spearmint und der zweite ein Pfefferminz. Dieser Fall ist also deswegen, weil ich schlussendlich nicht sagen kann welcher Kaugummi von welchem Zug stammt, doppelt so wahrscheinlich.

Ein typisches Beispiel für eine Verteilung bei der a ungefähr b entspricht ist das Geschlecht. Also es gibt in etwa genauso viele Männer wie Frauen – nicht ganz, schon bei der Geburt ist es nicht ganz gleich und später sterben Männer im schnitt früher, aber ich rede ja von ungefähr. Mit den Formeln für höhere n kann man dann berechnen wie wahrscheinlich es ist das eine Familie mit 7 Kindern nur Jungen oder nur Mädchen hat.

Die Formel für höhere n

Das leitet mich dazu über wie die Formel für höhere n aussieht. Es gibt zwei Methoden sie aufzustellen, eine grafische und eine die sich für den Computer eignet.

Die grafische fängt mit n =1 an und ist unter der Bezeichnung „pascalsches Dreieck“ bekannt.

Bei n=1 kann das Resultat entweder 1 x a oder 1 x b sein. Die Multiplikatoren schreibt man auf. Die nächste Zeile für n=2 erhält man, indem man als erstes und letztes Glied jeweils 1 setzt, bei jeder Zeile wird die Formel um einen Term länger und in der Mitte zwischen den beiden „1“ errechnet sich der Binominalkoeffizient durch Addition der beiden direkt darüberstehenden.

Also für n=2 sind es drei Koeffizienten. Vorne und hinten ke eine 1 und der mittlere errechnet sich aus den beiden oberen Koeffizienten also je 1:

Summe n
1 1 2 1
1 2 1 4 2

Die Summe aller Koeffizienten ist immer 2n.

So kann man weiter machen:

Summe n
1 1 2 1
1 2 1 4 2
1 3 3 1 8 3

Also ihr erkennt das System es würde weiter gehen mit 1-4-6-4-1 und 1-5-10-10-5-1.

Das geht noch für kleine n, aber da ich das Beispiel auch auf Raketentriebwerke anwenden will und da es Raketen mit bis zu 33 Triebwerken gibt wäre das doch etwas mühselig. In der Wikipedia findet man folgenden Pseudocode mit der man die Koeffizienten iterativ berechnen kann:

binomialkoeffizient(n, k)
1  wenn 2*k > n dann k = n-k
2  ergebnis = 1
3  für i = 1 bis k
4      ergebnis = ergebnis * (n + 1 - i) / i
5  rückgabe ergebnis

n ist wie oben wie oft man zieht also die maximale Potenz von an oder bn und k ist der jeweilige Index von links. In Pascal verwende ich folgende Implementierung die ziemlich straight ist:

function binomialkoeffizient(n, k: integer): extended;

var i: integer;

begin

  if 2 * k > n then

    k := n - k;

  result := 1;

  for i := 1 to k do

    result := result * (n + 1 - i) / i;

end;

Als Ergebnis habe ich Extended genommen, also eine Gleitpunktzahl wegen der Division. Das Resultat ist zwar immer eine Ganzzahl aber so bin ich auf der sicheren Seite.

Praktisches Anwendungsbeispiel. Cannabis soll nun ja legalisiert werden, heute hat die Gesetzesvorlage das Kabinett passiert. Im Entwurf steht drin, das jeder drei weibliche Pflanzen haben kann. Wie viele Pflanzen muss ich anbauen, damit die statistische Wahrscheinlich das ich drei oder mehr weibliche Pflanzen habe 50 Prozent ist, vorausgesetzt männliche und weibliche Pflanzen sind gleich verteilt?

Also vor n=3 muss ich gar nicht anfangen, ich habe jetzt das Dreieck mal anders geschrieben:

7 6 5 4 3 2 1 0 Summe n

1

3

3

1

8

3

1

4

6

4

1

16

4

1

5

10

10

5

1

32

5

1

6

15

20

15

6

1

64

6

1

7

21

35

35

21

8

1

128

7

Bei n=3 ist es zu 1 / 8 wahrscheinlich das es drei weibliche Pflanzen sind, also 25 Prozent

Bei n=4 sind es schon (1+4)/16 = 5/16 = 31,25 Prozent

Bei n=5 sind es (1+5+10)/32 = 16 / 32= 50 Prozent

Bei n=6 sind es (1+6+14+20)/64 = 41 / 64= 64 Prozent

Bei n=7 sind es (1+7+21+35+35)/128 = 99 / 128= 77 Prozent

Also ich müsste mindestens fünf Pflanzen aufziehen und wenn es mehr sind (für vier weibliche Pflanzen beträgt es bei n=5 die Wahrscheinlichkeit 1+5/32 = 18,75 Prozent und für fünf weibliche Pflanzen beträgt die Wahrscheinlichkeit 1/32 = ~ 3 Prozent diese Pflanzen dann vernichten oder besser verschenken.

Praxisbeispiel Zuverlässigkeit von Raketentriebwerken

Auf den ersten Blick hat ein Raketentriebwerk nun mal gar nichts damit zu tun das es zwei Geschlechter gibt und wie die entstehen durch zwei unterschiedliche Chromosomen. Aber es geht ja um Statistik. Auch hier gibt es genau zwei Zustände: Ein Raketentriebwerk kann einwandfrei arbeiten oder es kann ausfallen. Ebenso wie ein Auto fahren kann oder einen Defekt haben kann. Natürlich kann man technisch viel tun damit der Ausfall nicht vorkommt, aber ein Restrisiko bleibt immer, auch wenn es klein ist. Aktuelle Raketentriebwerke von denen ich die Zuverlässigkeit kenne liegen bei einer Zuverlässigkeit von 99,4 bis 99,9 Prozent. Aber es sind eben nicht 100 Prozent und daher kann mal eines ausfallen und je mehr Triebwerke eine Rakete hat, desto wahrscheinlicher ist ein Ausfall. Die Super Heavy hat 33 Triebwerke und soll auf 37 aufgerüstet werden. Hier hat man nun den Fall das die Fälle a und b nicht gleich hoch sind, sondern a (Kein Ausfall) ist viel wahrscheinlicher als b. In der Berechnung muss man dann die wahren Werte von a und b berücksichtigen.

Man setzt nun in die Formeln die Werte für a und b ein. Die Potenz von a und b gibt dann jeweils die Anzahl der Triebwerke die betroffen sind an, aber entwickeln wir das mal für die ersten zwei Fälle (also ein, zwei, Triebwerke) und a=0,994 und b = 1-a = 0,006. a steht für ein funktionierendes Triebwerk und b für ein ausgefallenes Triebwerk:

1 Triebwerk: a+b = 1

0,994 (1 funktionierendes Triebwerk) + 0,006 (0 funktionierende Triebwerke)= 1

2 Triebwerke: a² + 2ab + b² = 1

0,994² (2 Triebwerke) + 2 x 0,994 * 0,006 (1 Triebwerk) + 0,006² (0 Triebwerke) = 1

0,988 (2 Triebwerke laufen) + 0,011 (1 Triebwerk läuft) + 0,000036 (beide Triebwerke ausgefallen).

Ich denke das System ist klar, bei vielen Triebwerken macht man das am besten mit einem Programm, das ihr hier als windows-EXE herunterladen könnt.

Ich habe mal für 33 Triebwerke und einem a = 0,994 (der niedrigsten mir bekannten Zuverlässigkeit von aktuellen Triebwerken) und b=(1-a) = 0,006 eine Tabelle erstellen lassen:

a b Bin Koeffizient a Anteil a Summe a
33 0 1 0,8199 0,8199
32 1 33 0,1633 0,9832
31 2 528 0,0158 0,9990
30 3 5456 0,0010 1,0000
29 4 40920 0,0000 1,0000
28 5 237336 0,0000 1,0000
27 6 1107568 0,0000 1,0000
26 7 4272048 0,0000 1,0000
25 8 13884156 0,0000 1,0000
24 9 38567100 0,0000 1,0000
23 10 92561040 0,0000 1,0000
22 11 193536720 0,0000 1,0000
21 12 354817320 0,0000 1,0000
20 13 573166440 0,0000 1,0000
19 14 818809200 0,0000 1,0000
18 15 1037158320 0,0000 1,0000
17 16 1166803110 0,0000 1,0000
16 17 1166803110 0,0000 1,0000
15 18 1037158320 0,0000 1,0000
14 19 818809200 0,0000 1,0000
13 20 573166440 0,0000 1,0000
12 21 354817320 0,0000 1,0000
11 22 193536720 0,0000 1,0000
10 23 92561040 0,0000 1,0000
9 24 38567100 0,0000 1,0000
8 25 13884156 0,0000 1,0000
7 26 4272048 0,0000 1,0000
6 27 1107568 0,0000 1,0000
5 28 237336 0,0000 1,0000
4 29 40920 0,0000 1,0000
3 30 5456 0,0000 1,0000
2 31 528 0,0000 1,0000
1 32 33 0,0000 1,0000
0 33 1 0,0000 1,0000

Es sind eigentlich nur die ersten drei Zeilen für 33, 32 und 31 funktionierende Triebwerke wesentlich.

Also es ist zu über 80 Prozent wahrscheinlich, das kein Triebwerk ausfällt, zu 99,9 Prozent das es nicht mehr als zwei sind. Das ist doch beruhigend. Denn zwei Triebwerke machen bei 33 Triebwerken nur 6 Prozent des Schubs aus, das heißt mit etwas Schubüberschuss, das muss nicht mal viel sein, ist die Rakete sicherer als eine mit nur einem Triebwerk, denn das mit einer Wahrscheinlichkeit von 0,6 Prozent ausfallen, hier ist der Ausfall von zwei Triebwerken aber nur zu 0,1 Prozent wahrscheinlich. Da aber zu etwa 18 Prozent es wahrscheinlich ist das eines oder mehrere Triebwerke ausfallen, wird man mindestens mit einem Schubüberschuss von einem Triebwerk starten.

Zeichnet man die Verteilung der Binomialkoeffizienten grafisch so erhält man eine Glockenkurve. Hier die für n=33 und a=0,5 und b=0,5, also nutzbar z.B. um festzustellen wie viele von 33 Hanfpflanzen weiblich sind:

Mit steigendem A also höherer Zuverlässigkeit verschiebt sich die Kurve nach rechts, hier die Kurve für a=0,9 also 90 % Wahrscheinlichkeit das ein Triebwerk funktioniert. Nach der Kurve ist es am wahrscheinlichsten das 29 Triebwerke funktionieren.

Mit dem Wissen kann man natürlich Rückschlüsse ziehen. Es gab bisher drei Testzündungen / Starts einer Superheavy, eine Testzündung vor dem ersten Start mit zwei ausgefallenen Triebwerken, dann den Teststart im April mit drei Triebwerken, die beim Start ausfielen und nun im August eine mit vier ausgefallenen Triebwerken (man beachte, der Trend ist nicht rückläufig …) man kann nun a solange modifizieren bis das Maximum der Kurve bei 3 ausgefallenen Triebwerken liegt, macht man das rechnerisch so kommt man auf b=0.0938 oder a = 0,9062, also eine Ausfallwahrscheinlichkeit von knapp 10 Prozent.

Eine zweite Herangehensweise für das Design wäre es zu sagen: „Wir wollen das mit 99 % Wahrscheinlichkeit nicht mehr als 3 Triebwerke ausfallen“ dann kann man die Triebwerke so konstruieren das sie diese Ausfallwahrscheinlichkeit haben und einen Schubüberschuss von drei Triebwerken planen. Nehmen wir 99 %, das ist das Designkriterium für die Zentralstufe der Ariane 5, so errechnet man für b =0,0258 oder a= 0,9742. Obwohl dieser Wert um ein vielfaches schlechter ist als bei etablierten Raketentriebwerken, ist b als Restwahrscheinlichkeit eines Ausfalls um den Faktor 3 kleiner der Wert für b wenn man die Mitte der Kurve auf den Ausfallwert von 3 Triebwerken legt. Da erklärt sich relativ einfach daraus, dass in diesem Falle auch der rechte Teil der Kurve mitzählt.

Noch eine kleine Erläuterung des Programms:

Es gibt immer a+b=1, das heißt das Programm lässt nur die Eingabe von a zu, b wird daraus errechnet.

Verteilung“ Macht eine Verteilung für das angegebene n („Anzahl der Triebwerke“)

Chart“ macht eine Verteilungskurve, wenn ihr im Chart rechts klickt habt ihr Möglichkeiten das Chart zu exportieren, die Größe könnt ihr vorher durch die Größe des Fensters anpassen.

Export“ macht einen HTML-Export der Tabelle und exportiert das Chart als png.

Die beiden anderen Eingabefelder werden für die beiden Buttons gebraucht:

max=ausfall“ modifiziert a solange bis die maximale Wahrscheinlichkeit (Spitze der Glockenkurve) bei der Anzahl der ausgefallenen Triebwerke liegt.

Wahrscheinlichkeit“ ist etwas komplexer. Es modifiziert a solange bis die summierte Wahrscheinlichkeit (von 0 bis Anzahl der ausgefallenen Triebwerke) bei der angegebenen Wahrscheinlichkeit liegt. Da dies iterativ ist, kann man mit Fehlerdifferenz angeben wann die Suche abbremsen soll. In der Glockenkurve sieht man das vor allem an der Höhe der Y-Achse.

4 thoughts on “Die binomische Formel

  1. Für das Raptor bedeutet das im Umkehrschluss, dass es das unzuverlässigste Triebwerk seit der Erprobungsphase der A4 in Peenemünde ist.
    Wie daraus noch eine weitere Leistungssteigerung über die Steigerung des Kammerdruckes erfolgen soll ist mir schleierhaft. Der Booster soll innerhalb kürzester Zeit wieder Starten können hierzu ist aber eher ein extrem zuverlässiges Treibwerk nötig. Es werden Ausfallraten wie in der Luftfahrt benötigt. Aus jetziger Sicht ist das Utopie. Damit dürfte das Mondprogramm der NASA wohl nie die Nächsten 10 Jahre nicht zum Ziel kommen.

    1. Eine wiederverwendbare Rakete mit nicht wiederverwendbaren Triebwerken – St. Elon wird das schon packen. Und wenn nicht stellt er eben den Laden auf Feuerwerk um. Erfahrung mit publikationswirksamen Explosionen hat er ja reichlich.

      1. Wobei ich mir langfristig um die Triebwerke am wenigsten sorgen mache. Die werden schon irgendwann ausreichend zuverlässig werden. Wird nur halt noch ein paar Jahre dauern. Spannend wird der Hitzeschutz und die Abnutzung an der Start/Landeinfrastruktur. Da konnten wir noch nichts bzw. wenig von sehen. Die sind aber wirklich kritisch wenn man mit praktisch 0 Wartung wieder fliegen will. Das kann schnell einen Effekt ähnliche dem des Space Shuttles ergeben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.