Die Mathematik von 2er-Gruppen

Archiv
grandchild
Beiträge: 29
Registriert: Sa 12. Nov 2011, 18:18

Die Mathematik von 2er-Gruppen

Beitrag von grandchild »

EDIT:
Die Fusion-Crew hat den hier vorgeschlagenen Loesungsvorschlag von mir uebernommen (Danke :)). Das heisst, dass das Problem das hier beschrieben wird vorher existierte, jetzt aber nicht mehr.
Also: Losverteilung gerecht, alle Gruppen gleichberechtigt. Wunderbar...
___________________

Hi,
Hier wollte ich nur mal mathematisch-stochastisch diskutieren wie das mit den Gruppenverteilungen gedacht war.

Wer unbedingt ranten will, "wie ungerecht eine Losverteilung ist" (sic) - dafür gibt es den anderen Thread.
Ausserdem benutze ich "Karte bekommen" im Sinne von "Kaufoption erhalten", weil mehr ist es ja erstmal nicht.

Also: wie Jim schon richtig bemerkte besteht bei dem System wie es in der Mail dargestellt ist eine Bevorzugung von Teilnehmern von Gruppen mit einer geraden Anzahl von Mitgliedern.

Im Beispiel wird immer gerne 50% als Wahrscheinlichkeit angegeben. Aber ich nehme hier mal an dass:
  1. p = "Wahrscheinlichkeit ein Ticket aus der Gesamtheit der Fusiontickets zu erhalten"
  2. 1-p = "Wahrscheinlichkeit kein Ticket aus der Gesamtheit der Fusiontickets zu erhalten"
p ist demnach ganz einfach die Anzahl der verfügbaren Tickets geteilt durch die Anzahl der Leute die ein Ticket wollen (Vermutlich ist p<1 ;) )

Laut Newsletter gilt demnach:
  1. Ein Einzelprotofusionist (ob Mitglied einer Gruppe oder nicht) hat die Wahrscheinlichkeit p eine Karte zu erhalten.
  2. Eine Gruppe wird komplett mit Karten ausgestattet sobald 50% oder mehr der zugehörigen Mitglieder eine Karte haben.
Bei Gruppen mit 2 Mitgliedern gibt es 4 Varianten:
  1. Nein / Nein
  2. Nein / Ja
  3. Ja / Nein
  4. Ja / Ja
(Und ja, 2. und 3. sind verschieden, denn es sind 2 verschiedene Ereignisse ob Alice eine Karte und Bob keine Karte bekommt oder umgekehrt.)
Fall 2, 3 und 4 führen dazu dass die Gruppe ihre Tickets bekommt - 3 von 4 Fällen. Dass ergibt mit p die Wahrscheinlichkeiten:
  1. (1-p)² dass man als Teilnehmer keine Karte erhält, und
  2. (1-p)p + p(1-p) + p² = 2p-p² dass man als Teilnehmer eine Karte erhält.
Das beides im Vergleich zeigt, dass für alle p in [0,1] man als Mitglied einer 2er-Gruppe im Vorteil ist (grün ist Einzelbewerber, rot ist Bewerber-in-einer-2er-Gruppe):
Bild

Alle ungeraden Mitgliederzahlen sind gerecht. Das erklärt sich durch die Anzahl der Varianten: Bei 3 Leuten gibt es 4 Varianten wo die Gruppe gewinnt und 4 Varianten wo sie verliert. Malt es auf, dann sieht man es. [EDIT: Das stimmt nicht mehr; siehe zusätzlicher Effekt unten!]
Für geradzahlige Gruppenstärken von 4 bis 14 nähert sich die rote Kurve der grünen Linie an.

Interessant ist noch die Folgerung für die Fusion-Orga: Bei einem p von 0,5 (halb so viele Tickets wie Leute, die eins wollen) - wenn 75% aller 2er-Gruppen Tickets bekommen, unter der Annahme, dass viele oder alle sich in 2er-Gruppen zusammentun, dann bekommen nicht 50% der Leute die sich angemeldet haben ein Ticket (wie es ein p von 0,5 vorsehen würde) sondern 75% der Leute. Das hieße die anderthalbfache Menge an Karten müsste ausgegeben werden! Sicher uncool, wenn anstatt von 60.000 Leuten dann 90.000 da sind.
Horror-oder-auch-nicht-Szenario (bei p=0,5) ist: alles 2er-Gruppen, in jeder bekommt genau einer 1 Ticket, also bekommen alle ein Ticket, also doppelt so viele Leute wie geplant...

Ergebnis:
Das ist schlecht! Nicht das Losverfahren als solches. Das ist gerecht. (So schwer es auch für mich ist, als langjähriger Fusionist zu schlucken, dass mein Fusionticket vom Zufall abhängt und nicht davon dass ich das plane und schneller/besser/toller/fitter bin als andere. Könnte das das Problem sein von den Leuten die im anderen Thread jammern? Wer weiß...)

Aber die Implementierung scheint fehlerhaft zu sein (zumindest so wie sie in der Mail/auf der Website beschrieben wird).

Lösungsvorschlag:
Man errechnet p. Man lost für jede Gruppe, die sich bewirbt (ich definiere mal einzelne Leute als 1-Mann-Gruppe) mit p aus ob die Mitglieder je ein Ticket bekommen (alle oder niemand). Dann hat man (statistisch gesehen) Gleichverteilung erreicht.
Gruppen werden so nicht bevorzugt, denn alle Teilnehmer erhalten mit der Gruppe die Wahrscheinlichkeit p.
Einzelne werden auch nicht bevorzugt, denn sie erhalten ebenso die Wahrscheinlichkeit p.

Was noch verbliebe ist der Overhead, der dadurch entstehen könnte, dass (zufällig) nur oder viele große Gruppen ausgewählt werden. Die Wahrscheinlichkeit, dass dieser Overhead sehr gross ist, ist gering, aber besteht. Die Lösung hier wäre, die Lotterie einfach so oft erneut anzuschmeißen bis eine Gesamtticketzahl herauskommt, die der geplanten entspricht. Ein wiederholtes "Auslosen bis das Ergebnis stimmt" würde wohlgemerkt die Verteilungen im "Inneren" nicht verändern! D.h. es würden weder große, noch kleine, noch mittlere Gruppen bevorzugt (die Mitgliedszahlen würden sich ja gegenseitig kompensieren). Nur die Summe der Gruppengrößen würde verändert, und das kann der einzelnen Gruppe, dem einzelnen Mitglied egal sein.


Liebe Fusion, ich hoffe ihr stellt das noch klar, und dann weiß ich ob ich das gerecht ist oder nicht, ob ich durch meinen uuuuuunglaublichen Vorteil von grundlegender Wahrscheinlichkeitsrechnung fitter(TM) bin und mich in ne 2er-Gruppe tue, oder so. Ich hoffe ihr findet da ne gerechte Lösung, weil so ist es kein gerechtes Losverfahren.

Gruss,
J.

_____________
EDIT:
Es hat sich noch ein weiterer Effekt dazugesellt, der ungewollte Konsequenzen hat. Durch die 50%-Erfolgsquote bei den Gruppen ergibt sich (zusätzlich zu dem gerade/ungerade-Effekt) der Effekt, dass wenn sich
  1. sehr viele Leute auf Tickets bewerben, kleine Gruppen und Einzelpersonen bevorzugt werden,
  2. wenn sich weniger als doppelt so viele bewerben wie es Tickets gibt, große Gruppen zunehmend bevorzugt werden.
-> Siehe dazu auch die Grafik von mamako weiter unten.

Jetzt könnte man auf die tolle Idee kommen, einfach die Gruppen-Gewinnerquote mit p zu koppeln - tut das bloß nicht! Das gibt andere lustige Artefakte, die daher rühren wie die Gruppengröße durch 1/p teilbar ist oder nicht... ist auch egal, ist jedenfalls nicht gut =P

Mein Lösungsvorschlag von oben steht weiterhin. Der hat diese Effekte nicht.

EDIT2: noch ein bisschen Statistikporn:
Bild
Zuletzt geändert von grandchild am Fr 2. Dez 2011, 17:22, insgesamt 12-mal geändert.
knorke
Beiträge: 9
Registriert: Sa 12. Nov 2011, 18:55

Re: Die Mathematik von 2er-Gruppen

Beitrag von knorke »

Danke für den interessanten Thread. Ich habe P=.5 gesetzt und wollte eben einen Text schreiben. Aber du warst schneller, ausführlicher und mit unbestimmtem p genauer. :D

Danke
Loddsn
Beiträge: 2
Registriert: Sa 12. Nov 2011, 17:57

Re: Die Mathematik von 2er-Gruppen

Beitrag von Loddsn »

Dickes Lob, dass du dir die Mühe gemacht hast! Danke... :)
g0dard
Beiträge: 3
Registriert: Sa 12. Nov 2011, 20:18

Re: Die Mathematik von 2er-Gruppen

Beitrag von g0dard »

Danke! Nachdem ich die Mail gelesen hatte, konnte sich mein Hirn nich davor drücken sich in Wahrscheinlichkeitsberechnungen zu üben. Schön, dass jemand meine Intuition bestätigen konnte.
mamako
Beiträge: 12
Registriert: Sa 12. Nov 2011, 20:38

Re: Die Mathematik von 2er-Gruppen

Beitrag von mamako »

Hm, grandchild, also meiner Logik nach gibt es ein begrenztes Kartenkontingent, aus dem sich p errechnet. Also bei zwei Mal soviel Bewerbern wie Tickets haben wir p=0.5, bei weniger Bewerbern p>0.5 usw. Alles andere wäre unlogisch.

Die Rechenvorschrift folgt hierbei dann dem Ziehen ohne Berücksichtigung der Reihenfolge, aber mit Zurücklegen (sonst wären die Chancen nicht gleichverteilt). Man muß also die Wahrscheinlichkeit berechnen, daß bei n-maligem Ziehen (n=Gruppengröße) mit Zurücklegen mindestens n/2 Ziehungen erfolgreich sind (bei p aus Ratio Karten/Bewerber).

Durch die Cliquenbildung werden Zweiergruppen hierbei in jedem Fall bevorzugt.
NathanaelDK
Beiträge: 50
Registriert: Sa 12. Nov 2011, 15:13

Re: Die Mathematik von 2er-Gruppen

Beitrag von NathanaelDK »

Guter Thread. Danke dafür. Aber fehlt da nicht noch was? In deinem Beispiel über Zweiergruppen mit vier möglichen Szenarien sieht es so aus, als sei jedes Szenario gleich wahrscheinlich (25%). Diese Wahrscheinlichkeit ist aber vollkommen abhängig davon, wie viele Leute sich registrieren, korrekt? D.h., wenn sich 20% mehr Leute registrieren, als Karten verfügbar sind, ist die Wahrscheinlichkeit, keine Karte zugeteilt zu bekommen, geringer, als wenn sich der Menschenüberschuss auf 40% beläuft. Das gilt natürlich auch für deine anderen Beispiele oder übersehe ich hier nur irgendwas Offensichtliches?
mamako
Beiträge: 12
Registriert: Sa 12. Nov 2011, 20:38

Re: Die Mathematik von 2er-Gruppen

Beitrag von mamako »

Bild

@nathanael: Ja, das stimmt natürlich. Das wirkt sich auch auf die Gewinnwahrscheinlichkeit für die Gruppe aus. Ich habe das mal für verschiedene Einzelwahrscheinlichkeiten und Gruppengrößen aufgetragen.
(Ich habe es nur für 1 Person und dann für gerade Gruppengrößen berechnet).

EDIT: Ich erläutere nochmal den Plot: die Einzelwahrscheinlichkeiten p ergeben sich aus dem Verhältnis Kontingent/Bewerber. Es können nicht mehr Karten vergeben werden., als da sind. Sobald die Anzahl der Bewerber bekannt ist, kennt man somit p. Die Kurvenverläufe zeigen die veränderliche Wahrscheinlichkeit für die gesamte Gruppe, Optionen zu gewinnen, in Abhängigkeit von der Größe der Gruppe.

Für einen Bewerber, der über p keine Kenntnis hat, ist es somit am Schlauesten, sich als Zweiergruppe anzumelden. Habe ich hingegen sichere Kenntnis darüber, daß p > 0.7 (ca. 3 Bewerber auf 4 Karten), melde ich mich am besten als 14er-Gruppe an und habe damit eine Gewinwahrscheinlichkeit > 99% für die gesamte Gruppe.
Zuletzt geändert von mamako am Sa 12. Nov 2011, 21:24, insgesamt 1-mal geändert.
grandchild
Beiträge: 29
Registriert: Sa 12. Nov 2011, 18:18

Re: Die Mathematik von 2er-Gruppen

Beitrag von grandchild »

@mamako
Ja, das mit dem Kontingent ist bei mir auch so wie ich es aus deinem ersten Abschnitt lese. (Aber das war vielleicht auch nicht dein Kritikpunkt.)

Und du hast recht, das mit dem Zurücklegen hab ich komisch/falsch formuliert oben (hab den Originalpost verändert). Es ist eigentlich ein Ziehen (ohne Zurücklegen) von Jas und Neins (mit so vielen Jas wie es Tickets gibt, und so vielen Neins wie es Leute ohne Ticket geben wird) mit Reihenfolge (oder zumindest mit Zuordnung wer ein Ja und wer ein Nein bekommt).

Davon zunächst unabhängig ist der Gewinn/das Verlieren einer Gruppe. Und dort gilt (wie du sagst) Summe von Jas >= n/2. Diese zweite Betrachtung ist aber lediglich eine Betrachtung auf allen möglichen Ergebnissen der ersten Ziehung (von Einzeltickets), quasi eine Funktion davon. Und dabei sind die Fälle "Alice:Ja,Bob:Nein" und "Alice:Nein,Bob:Ja" 2 verschiedene, gleich wahrscheinliche Fälle, genau wie "Alice:Ja,Bob:Ja" und "Alice:Nein,Bob:Nein".

.
@NathanaelDK
Ich habe nur abschnittweise mal p zu einem festen Wert angenommen. Im allgemeinen ist er natürlich variabel. Allerdings sind die 4 Fälle des Ergebnisses einer 2er-Gruppe tatsächlich nicht gleich wahrscheinlich. Das hab ich allerdings auch nicht gesagt. Die Wahrscheinlichkeiten der 4 Fälle sind je nach p unterschiedlich, ich addiere nur die Wahrscheinlichkeiten für Fälle 2, 3 und 4, da es voneinander verschiedene Ereignisse sind. Die Formeln sind ja genannt, und die Wahrscheinlichkeiten der 4 Fälle ergeben sich darin.
Zuletzt geändert von grandchild am Sa 12. Nov 2011, 21:50, insgesamt 2-mal geändert.
grandchild
Beiträge: 29
Registriert: Sa 12. Nov 2011, 18:18

Re: Die Mathematik von 2er-Gruppen

Beitrag von grandchild »

@mamako
die formeln für dein bild können meiner meinung nach nicht so ganz stimmen, denn für 25% und 10% steht da, dass man ab 8 bzw. 10 Leuten in einer Gruppe gar nicht mehr an Tickets kommen kann. Das erscheint mir nicht logisch...

EDIT:
alles klar jetzt, stimmt so...
Zuletzt geändert von grandchild am So 13. Nov 2011, 03:08, insgesamt 1-mal geändert.
mamako
Beiträge: 12
Registriert: Sa 12. Nov 2011, 20:38

Re: Die Mathematik von 2er-Gruppen

Beitrag von mamako »

@grandchild: Yep, zusammen haben wir recht, mit Reihenfolge, mit Zurücklegen. Wir haben also Binomialverteilung und müssen dann p(X>=k) berechnen, wenn k=halbe Gruppengröße. Daraus ergeben sich dann je nach Anfangswahrscheinlichkeit verschiedene Verteilungen.
Gesperrt