Dobroć dopasowania
Poniżej przedstawiono przykłady pojawiające się w kontekście danych kategorycznych.
Test chi kwadrat PearsonaEdit
Test chi kwadrat Pearsona wykorzystuje miarę dobroci dopasowania, która jest sumą różnic między obserwowanymi i oczekiwanymi częstotliwościami wyników (czyli liczbą obserwacji), z których każda jest podniesiona do kwadratu i podzielona przez oczekiwanie:
χ 2 = ∑ i = 1 n ( O i – E i ) E i 2 {} ^{2}=suma _{i=1}^{n}{{}frac {(O_{i}-E_{i})}{E_{i}}}}^{2}}}
gdzie:
Oi = zaobserwowana liczba dla bloku i Ei = oczekiwana liczba dla bloku i, potwierdzona hipotezą zerową.
Częstotliwość oczekiwaną oblicza się w następujący sposób:
E i = ( F ( Y u ) – F ( Y l ) ) N {{displaystyle E_{i}} = F(Y_{u})- F(Y_{l})}
gdzie:
F = funkcja rozkładu kumulatywnego dla badanego rozkładu prawdopodobieństwa. Yu = górna granica dla klasy i, Yl = dolna granica dla klasy i, a N = wielkość próby
Wynikową wartość można porównać z rozkładem chi kwadrat, aby określić dobroć dopasowania. Rozkład chi kwadrat ma (k – c) stopni swobody, gdzie k jest liczbą niepustych komórek, a c jest liczbą szacowanych parametrów (w tym parametrów lokalizacji i skali oraz parametrów kształtu) dla rozkładu plus jeden. Na przykład, dla 3-parametrowego rozkładu Weibulla, c = 4.
Przykład: równe częstości mężczyzn i kobietEdit
Na przykład, aby przetestować hipotezę, że losowa próba 100 osób została wylosowana z populacji, w której mężczyźni i kobiety są równe w częstości, obserwowana liczba mężczyzn i kobiet zostanie porównana z teoretyczną częstością 50 mężczyzn i 50 kobiet. Jeśli w próbie było 44 mężczyzn i 56 kobiet, to
χ 2 = ( 44 – 50 ) 2 50 + ( 56 – 50 ) 2 50 = 1,44 {{(44-50)^{2}} \^{(56-50)^{2}+{(56-50)^{2} \^{powyżej 50}}=1,44}
Jeśli hipoteza zerowa jest prawdziwa (tzn. mężczyźni i kobiety są wybierani z równym prawdopodobieństwem w próbie), statystyka testu będzie wyciągnięta z rozkładu chi kwadrat z jednym stopniem swobody. Chociaż można by oczekiwać dwóch stopni swobody (po jednym dla mężczyzn i kobiet), musimy wziąć pod uwagę, że całkowita liczba mężczyzn i kobiet jest ograniczona (100), a zatem istnieje tylko jeden stopień swobody (2 – 1). Innymi słowy, jeśli znana jest liczba mężczyzn, to określona jest liczba kobiet i na odwrót.
Konsultacja rozkładu chi kwadrat dla 1 stopnia swobody pokazuje, że prawdopodobieństwo zaobserwowania tej różnicy (lub bardziej skrajnej od niej), jeśli mężczyźni i kobiety są równie liczni w populacji, wynosi około 0,23. Prawdopodobieństwo to jest wyższe niż konwencjonalne kryteria istotności statystycznej (.001-.05), więc normalnie nie odrzucilibyśmy hipotezy zerowej, że liczba mężczyzn w populacji jest taka sama jak liczba kobiet (tzn. uznalibyśmy naszą próbę za mieszczącą się w zakresie tego, czego oczekiwalibyśmy dla proporcji mężczyzn i kobiet 50/50.)
Zauważmy, że mechanizm, który wygenerował próbę jest losowy, w sensie niezależnego losowego wyboru z takim samym prawdopodobieństwem, tutaj 0.5 zarówno dla mężczyzn jak i kobiet. Jeśli, na przykład, każdy z 44 wybranych mężczyzn przyprowadził męskiego kolegę, a każda z 56 kobiet przyprowadziła żeńskiego kolegę, to każda ( O i – E i ) 2 {textstyle {(O_{i}-E_{i})}^{2}} wzrośnie o współczynnik 4, a każda E i {textstyle E_{i}} wzrośnie o współczynnik 2. Wartość statystyki podwoi się do 2,88. Znając ten leżący u podstaw mechanizm, powinniśmy oczywiście liczyć pary. W ogólności mechanizm ten, jeśli nie jest defensywnie losowy, nie będzie znany. Rozkład, do którego należy odnieść statystykę testową, może więc być bardzo różny od chi kwadratowego.
Przypadek dwumianowyEdit
Doświadczenie dwumianowe jest sekwencją niezależnych prób, w której próby mogą zakończyć się jednym z dwóch wyników, sukcesem lub porażką. Istnieje n prób, z których każda ma prawdopodobieństwo sukcesu, oznaczane przez p. Zakładając, że npi ≫ 1 dla każdego i (gdzie i = 1, 2, …, k), to
Ma to w przybliżeniu rozkład chi kwadratowy z k – 1 stopniami swobody. Fakt, że istnieje k – 1 stopni swobody, jest konsekwencją ograniczenia ∑ N i = n {suma N_{i}=n} . Wiemy, że istnieje k obserwowanych liczebności komórek, jednak gdy znane jest k – 1, pozostałe są jednoznacznie określone. Zasadniczo można powiedzieć, że istnieje tylko k – 1 dowolnie określonych liczb komórek, a więc k – 1 stopni swobody.
G-testEdit
G-testy są testami prawdopodobieństwa istotności statystycznej, które są coraz częściej stosowane w sytuacjach, w których wcześniej zalecane były testy chi-kwadrat Pearsona.
Ogólny wzór na G to
G = 2 ∑ i O i ⋅ ln ( O i E i ) , {{displaystyle G=2 ∑sum _{i}{O_{i}}} ⋅ ln ∑ lewa({frac {O_{i}}{E_{i}}}}} prawa)}}
gdzie N {textstyle N} to całkowita liczba obserwacji.
G-testy są zalecane co najmniej od wydania w 1981 roku popularnego podręcznika statystyki autorstwa Roberta R. Sokala i F. Jamesa Rohlfa.
.