Hallo Schmidts Katze,
ich finde deine Aufstellung schön.
Daran lässt sich nochmal mein Hauptargument demonstrieren.
Wenn in einer Menge die Elemente durchnummeriert sind, kann ich sie farblich markieren:
die ersten 2.5% sind grün, die nächsten 95% sind gelb, und die restlichen 2.5% rot.
Jetzt ziehe ich ein Element und soll raten, welche Farbe es hat; da sage ich doch gelb, und werde zu 95% rechthaben.
So weit, so gut, das dürfte unstrittig sein.
Jetzt drehe ich das Ticket um, und entdecke eine Nummerierung:
Ich bin Nr. 152645.
Das ändert natürlich nichts an meiner Annahme, daß ich mit 95%iger Wahrscheinlichkeit zu den Gelben gehöre.
Daraus folgt dann, daß Nr. 152645 gelb ist (mit einer Wahrscheinlichkeit von 95%), und daraus kann ich auf die Gesamtzahl der Elemente dieser Menge schließen (mit einer Wahrscheinlichkeit von 95%, rechtzuhaben).
(Fette Hervorhebung von mir)
Bis zu "Ich bin Nr. 152645.", ist es richtig.
Doch die Kenntnis der Ticketnummer ändert die Wahrscheinlichkeit. Das ist ja genau der Punkt. Darum geht es bei mir ja im Abschnitt 2.
Ich möchte die Änderung noch ein einem einfacheren bekannten Beispiel verdeutlichen:
Wahrscheinlichkeiten bei einem HIV-Test.
Der Test soll im Falle eine HIV-Infektion mit 99% Wahrscheinlichkeit positiv sein mit 1% negativ.
Falls die betreffende Person nicht infiziert ist, soll der Test in 99% der Fälle negativ sein und in 1% der Fälle positiv. Also wird immer in 99% der Fälle eine Infektion korrekt erkannt. Auch eine Nichtinfektion wird in 99% der Fälle korrekt erkannt.
Ein Trugschluss wäre jetzt aber folgendes:
Eine Person, die nicht weiß, ob sie HIV-infiziert ist, oder nicht unterzieht sich dem Test.
Der Test ist positiv. Die Person denkt, da der Test immer in 99% der Fälle eine Infektion korrekt erkennt, bin ich mit 99% Wahrscheinlichkeit HIV-infiziert.
Dies ist aber falsch! Die Wahrscheinlichkeit recht zu behalten bleibt bei der Kenntnis des Ergebnisses
nicht gleich!
Berechnung der Wahrscheinlichkeiten an einem Beispiel.
Voraussetzungen: Es gibt 1000000 Personen. Davon sind 0.1% mit HIV infiziert und 99.9% nicht. Also gibt es 1000 HIV-Infizierte und 999000 nicht-HIV-infizierte.
Es ist völlig unbekannt, ob eine Person HIV-infiziert ist oder nicht, für jede besteht die gleiche Wahrscheinlichkeit von 0.1%.
Jetzt werden alle Personen dem Test unterzogen.
Rechengang:
Von den 1000 HIV-Infizierten ist der Test bei 1000 * 99% = 990 positiv und bei 1000 * 1% = 10 negativ, da der Test in 99% der Fälle das richtige Ergebis liefert.
Von den 999000 nicht HIV-Infizierten ist der Test bei 999000 * 1% = 9990 positiv und bei 999000 * 99% = 989010 negativ, da der Test in 99% der Fälle das richtige Ergebis liefert.
Jetzt gibt es also 4 Gruppen:
nicht HIV-Infizierte, positiv getestet: 9990 hier ist der Test falsch
nicht HIV-Infizierte, negativ getestet: 989010 hier ist der Test richtig
HIV-Infizierte, positiv getestet: 990 hier ist der Test richtig
HIV-Infizierte, negativ getestet: 10 hier ist der Test falsch
Gesamt test falsch 9990 + 10 = 10000 = 1% von 1000000
Gesamt test richtig 989010 + 990 = 990000 = 99% von 1000000
Also ist der Test in 1% aller Fälle falsch und in 99% aller Fälle richtig. Mit dem Test liegen also 99% aller Personen richtig.
Aber wie groß ist die Wahrscheinlichkeit, dass der Test richtig ist, wenn er ein positives Ergebnis zeigt? Bleibt dann die Wahrscheinlichkeit richtig zu liegen von 99% erhalten oder nicht?
Natürlich bleibt sie erhalten, würden hier einige argumentieren, denn egal ob HIV-infiziert oder nicht, in 99% der Fälle ist das Ergebnis richtig.
Rechnen wir mal nach:
Wer positiv getestet wurde gehört entweder in die erste oder die dritte Gruppe. Ist also 'nicht HIV-infiziert und positiv getestet' oder 'HIV-infiziert und positiv getestet'
Das sind in der 1. Gruppe 9990 und in der zweiten Gruppe 990, insgesamt 9990 + 990 = 10980.
Un wieviele davon liegen richtig? Nur 990.
990 von 10980 sind gerade mal 9%. D.h. nur 9% der positiv getesteten sind auch HIV-infiziert. Nicht 99%. Der Test liegt bei den positiv getesteten in 91% aller Fälle falsch.
Die Wahrscheinlichkeit dafür, ob der Test das richtige Ergebnis liefert, ändert sich durch die Kenntnis des Testresultates!
Ebenso ändert sich die Wahrscheinlichkeit zu den mittleren 95% zu gehören von 95% mit der Kenntnis der Geburts- oder Ticketnummer auf irgendeinen unbekannten Wert, der von der unbekannten Verteilung der möglichen Gesamtanzahlen abhängt. Wäre die Verteilung bekannt, ließe sich die Wahrscheinlichkeit ausrechnen. Je nach Verteilung kann irgendetwas zwischen 0% und 100% rauskommen.
Die Wahrscheinlichkeit recht zu behalten bleibt bei der Kenntnis des Ergebnisses nicht gleich.
Grüße UMa