Articles

Goodness of fit

Hier volgen voorbeelden die zich voordoen in de context van categorische gegevens.

Pearsons chi-kwadraattoets

De chi-kwadraattoets van Pearson gebruikt een maat voor de goodness of fit die de som is van de verschillen tussen de waargenomen en de verwachte uitkomstfrequenties (d.w.z. het aantal waarnemingen), elk gekwadrateerd en gedeeld door de verwachting:

χ 2 = ∑ i = 1 n ( O i – E i ) E i 2 {{{i=1}^{n}{{\frac {(O_{i}-E_{i})}{E_{i}}^{2}}}

waar:

Oi = een waargenomen aantal voor bin i Ei = een verwacht aantal voor bin i, gesteld door de nulhypothese.

De verwachte frequentie wordt berekend door:

E i = ( F ( Y u ) – F ( Y l ) ) N {{i},=F(Y_{u})-,F(Y_{l}){},N},N}

waar:

F = de cumulatieve verdelingsfunctie voor de geteste kansverdeling. Yu = de bovengrens voor klasse i, Yl = de ondergrens voor klasse i, en N = de steekproefgrootte

De resulterende waarde kan worden vergeleken met een chi-kwadraatverdeling om de goodness of fit te bepalen. De chi-kwadraat-verdeling heeft (k – c) vrijheidsgraden, waarbij k het aantal niet-lege cellen is en c het aantal geschatte parameters (waaronder plaats- en schaalparameters en vormparameters) voor de verdeling plus één. Bijvoorbeeld, voor een Weibull-verdeling met 3 parameters is c = 4.

Voorbeeld: gelijke frequenties van mannen en vrouwenEdit

Voorbeeld: om de hypothese te toetsen dat een aselecte steekproef van 100 mensen is getrokken uit een populatie waarin mannen en vrouwen even vaak voorkomen, zou het waargenomen aantal mannen en vrouwen worden vergeleken met de theoretische frequenties van 50 mannen en 50 vrouwen. Als er 44 mannen in de steekproef zaten en 56 vrouwen, dan

χ 2 = ( 44 – 50 ) 2 50 + ( 56 – 50 ) 2 50 = 1,44 {\displaystyle \chi ^{2}={(44-50)^{2} \boven 50}+{(56-50)^{2} \boven 50}=1.44}

Als de nulhypothese waar is (d.w.z. dat mannen en vrouwen met gelijke waarschijnlijkheid in de steekproef zijn gekozen), zal de teststatistiek worden getrokken uit een chi-kwadraatverdeling met één vrijheidsgraad. Hoewel men twee vrijheidsgraden zou verwachten (één voor elk van de mannen en één voor elk van de vrouwen), moet men er rekening mee houden dat het totale aantal mannen en vrouwen beperkt is (100), en dat er dus slechts één vrijheidsgraad is (2 – 1). Met andere woorden, als het aantal mannen bekend is, is het aantal vrouwen bepaald, en omgekeerd.

Raadpleging van de chi-kwadraatverdeling voor 1 graad van vrijheid leert dat de kans dat dit verschil (of een extremer verschil dan dit) wordt waargenomen als mannen en vrouwen even talrijk zijn in de bevolking, ongeveer 0,23 is. Deze kans is groter dan de conventionele criteria voor statistische significantie (.001-.05), dus normaal gesproken zouden we de nulhypothese dat het aantal mannen in de bevolking even groot is als het aantal vrouwen niet verwerpen (d.w.z. we zouden onze steekproef beschouwen binnen het bereik van wat we zouden verwachten voor een 50/50 man/vrouw-verhouding.)

Noteer de aanname dat het mechanisme dat de steekproef heeft gegenereerd willekeurig is, in de zin van onafhankelijke willekeurige selectie met dezelfde waarschijnlijkheid, hier 0,5 voor zowel mannen als vrouwen. Als bijvoorbeeld elk van de 44 geselecteerde mannetjes een mannelijk maatje meebrengt en elk van de 56 vrouwtjes een vrouwelijk maatje, dan neemt elk ( O i – E i ) 2 {(O_{i}-E_{i})}^{2}} toe met een factor 4, terwijl elk E i {(O_{i}-E_{i})}^{2}} toeneemt met een factor 2. De waarde van de statistiek verdubbelt dan tot 2,88. Als we dit onderliggende mechanisme kennen, moeten we natuurlijk paren tellen. In het algemeen zal het mechanisme, indien het niet verdedigbaar willekeurig is, niet bekend zijn. De verdeling waarnaar de teststatistiek moet worden verwezen, kan dan ook sterk afwijken van chi-kwadraat.

Binomiaal gevalEdit

Een binomiaal experiment is een opeenvolging van onafhankelijke proeven waarbij de proeven kunnen resulteren in één van twee uitkomsten, succes of mislukking. Er zijn n proeven met elk een kans op succes, aangeduid met p. Op voorwaarde dat npi ≫ 1 voor elke i (waarbij i = 1, 2, …, k), dan

Dit heeft ongeveer een chi-kwadraat verdeling met k – 1 vrijheidsgraden. Dat er k – 1 vrijheidsgraden zijn, is een gevolg van de restrictie ∑ N i = n {\displaystyle \sum N_{i}=n} . We weten dat er k waargenomen celtellingen zijn, maar zodra k – 1 bekend zijn, is de resterende op unieke wijze bepaald. In principe kan men zeggen dat er slechts k – 1 vrij bepaalde celtellingen zijn, dus k – 1 vrijheidsgraden.

G-testEdit

G-tests zijn likelihood-ratio tests van statistische significantie die steeds vaker worden gebruikt in situaties waar voorheen Pearson’s chi-kwadraat tests werden aanbevolen.

De algemene formule voor G is

G = 2 ∑ i O i ⋅ ln ( O i E i ) , {\displaystyle G=2sum _{i}{O_{i}\cdot \ln \left({\frac {O_{i}{E_{i}}}}right)},}

∑ i O i = ∑ i E i = N {\displaystyle \sum _{i}O_{i}=\sum _{i}E_{i}=N}

waarbij N {{\style N}} het totale aantal waarnemingen is.

G-tests worden ten minste aanbevolen sinds de editie van 1981 van het populaire statistiekleerboek van Robert R. Sokal en F. James Rohlf.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *