Articles

Anpassungsgüte

Nachfolgend finden Sie Beispiele, die im Zusammenhang mit kategorialen Daten auftreten.

Pearsons Chi-Quadrat-TestBearbeiten

Der Chi-Quadrat-Test von Pearson verwendet ein Maß für die Anpassungsgüte, das die Summe der Differenzen zwischen den beobachteten und den erwarteten Ergebnishäufigkeiten (d. h. die Anzahl der Beobachtungen) ist, die jeweils quadriert und durch die Erwartung geteilt werden:

χ 2 = ∑ i = 1 n ( O i – E i ) E i 2 {\displaystyle \chi ^{2}=\sum _{i=1}^{n}{{\frac {(O_{i}-E_{i})}{E_{i}}}^{2}}

Wobei:

Oi = eine beobachtete Anzahl für Bin i Ei = eine erwartete Anzahl für Bin i, die durch die Nullhypothese behauptet wird.

Die erwartete Häufigkeit wird berechnet durch:

E i = ( F ( Y u ) – F ( Y l ) ) N {\displaystyle E_{i}\,=\,{\bigg (}F(Y_{u})\,-\,F(Y_{l}){\bigg )},N}

Wobei:

F = die kumulative Verteilungsfunktion für die zu testende Wahrscheinlichkeitsverteilung. Yu = die obere Grenze für Klasse i, Yl = die untere Grenze für Klasse i und N = der Stichprobenumfang

Der resultierende Wert kann mit einer Chi-Quadrat-Verteilung verglichen werden, um die Anpassungsgüte zu bestimmen. Die Chi-Quadrat-Verteilung hat (k – c) Freiheitsgrade, wobei k die Anzahl der nicht leeren Zellen und c die Anzahl der geschätzten Parameter (einschließlich Orts- und Skalenparameter und Formparameter) für die Verteilung plus eins ist. Zum Beispiel, für eine 3-Parameter Weibull-Verteilung ist c = 4.

Beispiel: Gleiche Häufigkeiten von Männern und FrauenBearbeiten

Zum Beispiel, um die Hypothese zu testen, dass eine Zufallsstichprobe von 100 Personen aus einer Population gezogen wurde, in der Männer und Frauen gleich häufig sind, würde die beobachtete Anzahl von Männern und Frauen mit den theoretischen Häufigkeiten von 50 Männern und 50 Frauen verglichen werden. Wenn es in der Stichprobe 44 Männer und 56 Frauen gab, dann

χ 2 = ( 44 – 50 ) 2 50 + ( 56 – 50 ) 2 50 = 1,44 {\displaystyle \chi ^{2}={(44-50)^{2} \über 50}+{(56-50)^{2} \über 50}=1.44}

Wenn die Nullhypothese wahr ist (d. h., Männer und Frauen sind mit gleicher Wahrscheinlichkeit in der Stichprobe), wird die Teststatistik aus einer Chi-Quadrat-Verteilung mit einem Freiheitsgrad gezogen. Obwohl man zwei Freiheitsgrade erwarten könnte (jeweils einen für die Männer und Frauen), müssen wir berücksichtigen, dass die Gesamtzahl der Männer und Frauen begrenzt ist (100) und es daher nur einen Freiheitsgrad gibt (2 – 1). Mit anderen Worten, wenn die Anzahl der Männer bekannt ist, wird die Anzahl der Frauen bestimmt und umgekehrt.

Die Betrachtung der Chi-Quadrat-Verteilung für 1 Freiheitsgrad zeigt, dass die Wahrscheinlichkeit, diesen Unterschied (oder einen extremeren Unterschied als diesen) zu beobachten, wenn Männer und Frauen in der Population gleich zahlreich sind, ungefähr 0,23 beträgt. Diese Wahrscheinlichkeit ist höher als die konventionellen Kriterien für statistische Signifikanz (.001-.05), so dass wir normalerweise die Nullhypothese, dass die Anzahl der Männer in der Population gleich der Anzahl der Frauen ist, nicht zurückweisen würden (d.h. wir würden unsere Stichprobe als innerhalb des Bereichs dessen betrachten, was wir für ein 50/50 Männer/Frauen-Verhältnis erwarten würden)

Beachten Sie die Annahme, dass der Mechanismus, der die Stichprobe erzeugt hat, zufällig ist, im Sinne einer unabhängigen Zufallsauswahl mit der gleichen Wahrscheinlichkeit, hier 0,5 für Männer und Frauen. Wenn zum Beispiel jedes der 44 ausgewählten Männchen einen männlichen Kumpel und jedes der 56 Weibchen einen weiblichen Kumpel mitbringt, erhöht sich jeder ( O i – E i ) 2 {\textstyle {(O_{i}-E_{i})}^{2}} um den Faktor 4, während sich jeder E i {\textstyle E_{i}} um den Faktor 2 erhöht. Der Wert der Statistik verdoppelt sich auf 2,88. Wenn wir diesen zugrunde liegenden Mechanismus kennen, sollten wir natürlich Paare zählen. Im Allgemeinen wird der Mechanismus, wenn er nicht nachweislich zufällig ist, nicht bekannt sein. Die Verteilung, auf die sich die Teststatistik beziehen sollte, kann dementsprechend sehr verschieden von der Chi-Quadrat-Verteilung sein.

BinomialfallBearbeiten

Ein Binomialversuch ist eine Folge von unabhängigen Versuchen, bei der die Versuche zu einem von zwei Ergebnissen führen können, Erfolg oder Misserfolg. Es gibt n Versuche mit jeweils einer Erfolgswahrscheinlichkeit, bezeichnet mit p. Vorausgesetzt, dass npi ≫ 1 für jedes i (mit i = 1, 2, …, k), dann

Dies hat näherungsweise eine Chi-Quadrat-Verteilung mit k – 1 Freiheitsgraden. Die Tatsache, dass es k – 1 Freiheitsgrade gibt, ist eine Folge der Einschränkung ∑ N i = n {\displaystyle \sum N_{i}=n} . Wir wissen, dass es k beobachtete Zellzahlen gibt, aber sobald k – 1 bekannt sind, ist die verbleibende eindeutig bestimmt. Im Grunde kann man sagen, es gibt nur k – 1 frei bestimmte Zellzahlen, also k – 1 Freiheitsgrade.

G-TestEdit

G-Tests sind Likelihood-Ratio-Tests zur Bestimmung der statistischen Signifikanz, die zunehmend in Situationen verwendet werden, in denen früher Pearson’s Chi-Quadrat-Tests empfohlen wurden.

Die allgemeine Formel für G lautet

G = 2 ∑ i O i ⋅ ln ( O i E i ) , {\displaystyle G=2\sum _{i}{O_{i}\cdot \ln \left({\frac {O_{i}}{E_{i}}\right)},}

∑ i O i = ∑ i E i = N {\displaystyle \sum _{i}O_{i}=\sum _{i}E_{i}=N}

wobei N {\textstyle N} die Gesamtzahl der Beobachtungen ist.

G-Tests werden spätestens seit der 1981er Ausgabe des populären Statistik-Lehrbuchs von Robert R. Sokal und F. James Rohlf empfohlen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.