![]()
Jetzt ist ja wieder Fussball-WM-Zeit und es gibt wieder einmal die Sammelbilder von Panini. Die gab es schon zu meiner Jugend. Das Grundkonzept gibt es aber auch woanders, man sammelt Bilder und klebt sie in ein Album ein. Ich war nie Fan von so was, schon als Kind merkte ich, dass man wahnsinnig viele Tütchen kaufen musste oder viele Freunde und Bekannte zum Tauschen haben musste. Das Einzige, wo ich mal was eingeklebt habe, waren Alben von der Bank, wo man, wenn man was aufs Konto einzahlte, einen Bogen bekam und zum Weltspartag mehrere. Da lief das aber anders, denn man konnte gleich sagen, dass man diesen oder jenen Bogen schon hatte.
Ich habe zwar Mathematik bis zur 12. Klasse gehabt und dann auch noch zweimal im Studium, aber es ist nicht eines meiner Lieblingsfächer. Das meiste, was höhere Mathematik angeht, habe ich vergessen (Differenzieren, Integrieren), was ich im Alltag brauche, sind meist Lösungen mit einer Unbekannten. Formeln umstellen und etwas Statistik für die Auswertung von Messergebnissen (Wenn man zwei Analysenwerte hat, die 5 % auseinander liegen und 20 % höher als Grenzwert, wie wahrscheinlich ist es, dass der Grenzwert überschritten wurde?).
Aber schon an einer mathematischen Lösung des Problems: Wenn ich n Karten zum Sammeln habe und m stecken in einer Tüte, wie viele Tüten muss ich im Mittel kaufen, bis ich das Album voll habe, scheitere ich.
Aber ich bin Programmierer oder auf Neudeutsch „Softwareentwickler“ (mir gefällt der Ausdruck nicht, weil ich immer bei Entwickler an die Chemikalie bei der Fotografie denken muss, im Englischen klingt Developer auch besser, nach meinem Studienabschluss bin ich übrigens Diplom-Ingenieur Medieninformatik, was noch skurriler ist, weil wir mit Medien im Studium nur eine Vorlesung hatten, aber der Prof, der die hielt, setzte die Umbenennung des Titels durch, wir waren just der erste Jahrgang, der diesen Titel erhielt, heute ist es noch schlimmer, da wäre ich Bachelor …).
In dem Fall schreibe ich ein Programm, um das zu testen. Ich veröffentliche hier nicht den Code, es ist schnell in 3 Stunden zusammengerotzt worden und man könnte einiges optimieren. Es ist ziemlich langsam, weil ich nach jedem Tütchen schaue, ob alle Bilder schon voll sind. Das könnte man auch erst nach 980 Bildern starten und das ginge auch mit m Bildern anstatt n, und man könnte die Simulation mit z Durchgängen auf alle Prozessoren verteilen, die dann nur das Array Statistik sharen, aber es geht ja nur um eine Demo und kein Produktivsystem, daher habe ich die schnellste Lösung programmiert.
Das Programm braucht bei der aktuellen WM (980 Bilder, 7 pro Tüte) etwa 2 Sekunden für 1.000 Durchläufe, schon nach wenigen Tausend Durchläufen erhält man eine Näherung an das korrekte Ergebnis von 1045 Tütchen bis auf eine Abweichung von 1–3 Tütchen, aber für eine schöne Abbildung der Verteilung müsst ihr etwas länger rechnen lassen, in diesem Falle für die Grafik 1 Million Durchläufe.

Wer mal Physik studiert hat, dem kommt diese Kurve bekannt vor, es ist die Maxwell-Boltzmann-Verteilung. Diese Verteilung hat z. B. die Geschwindigkeit eines Gases. Also wenn man in einem Kubikmeter Luft von jedem Molekül die Geschwindigkeit messen könnte und die Geschwindigkeit in der X-Achse aufträgt und die Anzahl der gemessenen Moleküle in der Y-Achse, dann kommt so eine Kurve raus. Der Grund: Sie fängt bei Null an (bzw. hier: bei 140, da man mindestens 140 Tütchen kaufen muss, um das Album voll zu bekommen (140 x 7 = 980)). Moleküle können keine Energie unter Null besitzen und die haben sie nur am absoluten Nullpunkt, also Null Grad Kelvin. Der lange Schwanz nach außen bedeutet bei Molekülen, dass es immer einige gibt, die eine extrem hohe Geschwindigkeit haben, viel höher als die mittlere Geschwindigkeit. Das hat auch echte Folgen. So verliert die Erde dauernd die Gase Wasserstoff und Helium, weil einige wenige Moleküle so schnell sind, dass sie die Fluchtgeschwindigkeit überschreiten. Bei den anderen schwereren Gasen kommt das auch vor, aber der Anteil ist um Potenzen geringer, sodass diese Verluste viel kleiner sind. Beim Wasserstoff sind es 3 kg/s, bei Helium mit der vierfachen Atommasse das aber auch seltener ist, nur 0,05 kg/s.
Erwartet hätte ich, weil sie mir öfters in der Statistik vorkommt, eine Glockenkurve, also auch eine solche Kurve, aber symmetrisch. Der häufigste Wert ist wegen des weit herauslaufenden Schwanzes übrigens nicht der Mittelwert, sondern liegt links davon, bei etwa 960 bis 980 Tütchen.
Im jedem Falle ist es ein Groschengrab. Ein Tütchen mit 7 Bildern kostet 1,50 Euro, mindestens 140 muss man kaufen, da ist man schon 210 Euro los, von „Groschengrab“ kann man da schon nicht mehr sprechen, eher von „Geldscheingrab“. Im Mittel müsste man sogar weit über 1.000 Tütchen kaufen, bis man statistisch abgesichert alle Bilder hat, also 1.500 Euro hinblättern – vor der WM 2026 hätte man dafür wohl alle Spiele der deutschen Mannschaft im Stadion erleben können.
Einfacher wäre es wohl, nachzuschlagen, wie man dies mit Hilfe der Statistik berechnen kann. Hier finde ich, ist die KI eine echte Hilfe. Für viele Fragestellungen, die ich habe, weiß ich nicht, wie ich schnell relevante Suchergebnisse finde, weil ich den Fachbegriff nicht kenne, in diesem Fall – die KI spuckt ihn im ersten Absatz raus – „Coupon-Collector-Problem“. So nutze ich inzwischen die KI, sie liefert mir oft schnell relevante Infos, wobei ich aber immer noch auf die Links gehe, weil die KI oft was falsch aus den Texten interpretiert, oftmals vertauscht sie Angaben, wenn in einem Absatz mehrere Zahlen auftauchen.
Für alle, die es nun genau wissen wollen, hier noch die Erklärung der KI:
„Gibt es eine Formel mit der man die mittlere Wahrscheinlichkeit berechnen kann bei Sammelbildern (n Bilder) und m wahllos gezogenen Bildern pro Päckchen?“
Ja, die gibt es! Das ist der absolute Klassiker unter den mathematischen Problemen und nennt sich das Coupon-Collector-Problem (auf Deutsch: Sammler-Problem).
Wenn du wissen willst, wie viele Päckchen (oder Bilder) du im Durchschnitt (Erwartungswert) kaufen musst, um alle n Bilder deiner Sammlung vollzubekommen, gibt es dafür eine exakte Formel.
Hier ist die Aufschlüsselung, wie man das berechnet:
1. Die Grundformel (Einzelne Bilder gezogen)
Wenn du die Bilder einzeln (also immer eins nach dem anderen, m=1) kaufen würdest, berechnet sich der Erwartungswert E(X) für die Anzahl der benötigten Bilder wie folgt:
E(X)=n⋅i=1∑ni1=n⋅(1+21+31+⋯+n1)
Der Teil in der Klammer ist die sogenannte Harmonische Zahl (Hn). Für große Alben (z. B. n=600 Sticker) kann man das extrem gut mit dem natürlichen Logarithmus (ln) annähern:
E(X)≈n⋅(ln(n)+γ)
(Dabei ist γ≈0,57721 die Euler-Mascheroni-Konstante).
2. Der Faktor mit m Bildern pro Päckchen
Jetzt ziehst du aber pro Päckchen m Bilder auf einmal. Hier müssen wir mathematisch sauber unterscheiden, wie die Päckchen befüllt sind:
Fall A: Im selben Päckchen können Doppelte sein (Ziehen mit Zurücklegen)
Das ist mathematisch der einfachere Fall. Wenn die m Bilder in einem Päckchen völlig unabhängig voneinander reingepackt werden, teilst du das Gesamtergebnis einfach durch m:
Anzahl Päckchen=mn⋅Hn
Fall B: Im selben Päckchen sind nie Doppelte (Ziehen ohne Zurücklegen)
In der Realität (z. B. bei Panini-Bildern) sorgt die Verpackungsmaschine meistens dafür, dass in einem einzelnen Päckchen keine Doppelten sind. Das verkürzt das Sammeln ein kleines bisschen, weil jedes Päckchen garantiert m verschiedene Bilder enthält.
Die exakte Formel für die erwartete Anzahl an Päckchen E(P) lautet dann:
E(P)=i=0∑n−1n−in⋅m1…
(bzw. exakter über die Wahrscheinlichkeiten per hypergeometrischer Verteilung)
Für die Praxis nutzt man meistens eine sehr genaue und bewährte Näherungsformel:
E(P)≈mn⋅(ln(n)+γ)+2⋅mm−1
Hinweis: Der zweite Term (+2mm−1) ist ein kleiner Korrekturfaktor, weil im allerletzten Päckchen oft weniger als m neue Bilder fehlen, um das Album vollzumachen. Da dieser Wert maximal gegen 0,5 läuft, ist er bei großen Alben fast vernachlässigbar.
Wenn man die klassische Sammelbild-Rechnung (Coupon-Collector-Problem) auf die WM 2026 anwendet:
- 980 verschiedene Sticker
- 7 Sticker pro Tüte
Dann ergeben sich folgende Werte:
Theoretisches Minimum
Wenn es keine Doppelten gäbe:
980/7=140980 / 7 = 140980/7=140
Du bräuchtest also mindestens 140 Tüten (980 Sticker) bzw. praktisch 140 Tüten + 0 Sticker Reserve.
Realistische Erwartung ohne Tauschen
Der Erwartungswert für eine vollständige Sammlung beträgt:
980⋅H980≈7315 Sticker980 \cdot H_{980} \approx 7315 \text{ Sticker}980⋅H980≈7315 Sticker
Das entspricht:
7315/7≈1045 Tu¨ten7315 / 7 \approx 1045 \text{ Tüten}7315/7≈1045 Tu¨ten
Also durchschnittlich etwa 1.045 Tüten.
Anteil der Doppelten
- Gekaufte Sticker: ca. 7.315
- Benötigte verschiedene Sticker: 980
- Doppelte: ca. 6.335
Das heißt rund 87 % aller gekauften Sticker wären am Ende doppelt. Das ist der Grund, warum Tauschen so wichtig ist.
Kosten
Bei einem Preis von 1,50 € pro Tüte (deutscher Handel)
1045×1,50€≈1.568€1045 \times 1,50€ \approx 1.568€1045×1,50€≈1.568€
Bei 1,25 £ pro Tüte (UK) läge man bei etwa 1.306 £.
Mit Tauschen
Erfahrungsgemäß sinkt der Bedarf drastisch. Bei früheren Panini-Alben lag man mit intensivem Tauschen oft bei etwa 45–60 % der theoretischen Durchschnittskosten.
Für die WM 2026 wären daher grob:
- 450–650 Tüten bei gutem Tauschpartner-Netzwerk
- 140 Tüten als absolutes Minimum (unmöglich ohne perfekte Verteilung)
eine realistische Größenordnung.
Für den Vergleich mit früheren Turnieren:
| Turnier | Sticker | Tüteninhalt |
|---|---|---|
| WM 2018 | 682 | 5 |
| WM 2022 | 670 | 5 |
| WM 2026 | 980 | 7 |
Die WM 2026 ist damit das bisher größte Panini-WM-Album.
Soviel von der KI, nun noch zum Abschluss noch meinen Senf dazu
Wenn ihr wollt, könnt ihr mit meinem Programm mal ausrechnen, wie teuer das bei den letzten WMs gewesen wäre. 1970 fing Panini damit an, damals noch mit 270 Bildern, je 3 pro Tüte, also 90 Tütchen im Idealfall. Mein Programm errechnet 554 Tütchen, also 6,15-mal mehr, das ist nur ein leicht besserer Faktor als diesmal (7,45). Ich glaube, die Firma macht das absichtlich so, dass sie die Bilderzahl pro Tütchen so wählt, dass ihr Verdienst maximiert wird, die Käufer aber sich nicht abwenden, weil es zu unwahrscheinlich ist, dass man alle Bilder bekommt, selbst mit Tauschen soll man nach der KI, ja ungefähr die doppelte Zahl an Bildern kaufen, die man braucht um das Album voll zu bekommen. Verdienstspanne schon mal um 100 % erhöht!
Als ich bei der WM 1970 nach der Bilderzahl suchte, kam ich auf eine Fanseite, in der erwähnt wurde, dass die Bilder nicht gleich häufig vorkommen:
„Besonderheiten: Die 243 Karten lassen sich relativ genau in einem zwei Drittel Verhältnis einteilen in 81 rare bzw. teilweise sehr rare Karten und 162 weniger rare Karten. … Kenner und Sammler der Serie bezeichnen sie nicht zuletzt aufgrund ihres Alters und der extremen Seltenheit mancher Karten und der Sticker als den Rolls Royce von Panini. Ein unbenutztes komplettes Set erzielt heutzutage teilweise schon fünfstellige Beträge, aber auch für komplette Alben in einem ordentlichen Zustand werden mittlerweile oftmals schon vierstellige Euro Summen geboten“.
Also gezielt bestimmte Karten zu verknappen, wie Spitzenspieler, die jeder, auch Leute wie ich, die mit Fußball nichts am Hut haben, kennen, wäre echt gemein. Dabei muss sich die Firma schon jetzt dumm und dämlich verdienen: Billig sind die Sammeltütchen nicht, man muss mehr kaufen, als man braucht, um das Album voll zu bekommen, und zwar nicht einige mehr, sondern ein Vielfaches der 980 Bilder.
Bei dem Begriff „dumm und dämlich verdienen“ fällt mir wieder meine Lieblingsfirma ein: SpaceX. Die ging ja an die Börse, nach einem Ausverkauf der überzeichneten IPO-Aktien ist der Kurs im freien Fall: aktuell bei 152 Dollar, unter dem Einstandskurs am 12.6. (160 Dollar) und weit weg vom Spitzenkurs von 225,64 Dollar. Damit hat die Firma in nicht mal zwei Wochen runde 600 Milliarden Dollar an Wert verloren. Also dafür hätte man sogar zum Mars fliegen können, wenn man das wollte und nicht nur ankündigt ….
Hier noch ein Link zum Programm. Geschrieben in Lazarus (freie Pascal IDE), ein direkt ausführbares Windows Programm ist im Archiv enthalten.
Erinnert mich daran, dass ich bei der Matura den Fehler gemacht habe nicht Wahrscheinlichkeitsrechnung, sondern Kurvendiskussion zu wählen. (Ersteres war imo. nachträglich interessanter.)
Und bei kleinen Gedankenexperimenten sind die aktuellen sogenannten K.Is doch oft ganz nützlich. (Man muß trotzdem immer noch darauf achten, dass kein Blödsinn reinhalluziniert wird.)