Articles

Bondade de ajuste

Os seguintes são exemplos que surgem no contexto de dados categóricos.

Teste de Qui-quadrado de PearsonEditar

O teste de Qui-quadrado de Pearson utiliza uma medida de bondade de ajuste que é a soma das diferenças entre as frequências de resultados observados e esperados (ou seja, contagens de observações), cada uma ao quadrado e dividida pela expectativa:

χ 2 = ∑ i = 1 n ( O i – E i ) E i 2 ^{\i}=sum _{i=1}^{n}{{\i}{\i_frac {(O_{i}-E_{i})}{E_{i}}^{2}}

where:

Oi = uma contagem observada para bin i Ei = uma contagem esperada para bin i, afirmada pela hipótese nula.

A frequência esperada é calculada por:

E i = ( F ( Y u ) – F ( Y l ) ) N estilo de jogo E_i_,=,{\i},N (F(Y_u})-,F(Y_l}){\i}

where:

F = a função de distribuição cumulativa para a distribuição de probabilidade a ser testada. Yu = o limite superior para a classe i, Yl = o limite inferior para a classe i, e N = o tamanho da amostra

O valor resultante pode ser comparado com uma distribuição qui-quadrada para determinar a bondade do ajuste. A distribuição qui-quadrado tem (k – c) graus de liberdade, onde k é o número de células não vazias e c é o número de parâmetros estimados (incluindo parâmetros de localização e escala e parâmetros de forma) para a distribuição mais um. Por exemplo, para uma distribuição Weibull de 3 parâmetros, c = 4,

Exemplo: frequências iguais de homens e mulheresEdit

Por exemplo, para testar a hipótese de que uma amostra aleatória de 100 pessoas foi retirada de uma população em que homens e mulheres são iguais em frequência, o número observado de homens e mulheres seria comparado com as frequências teóricas de 50 homens e 50 mulheres. Se houvesse 44 homens na amostra e 56 mulheres, então

χ 2 = ( 44 – 50 ) 2 50 + ( 56 – 50 ) 2 50 = 1,44 ^{\\i}={(44-50)^{2} \mais de 50}+{(56-50)^{2} \mais de 50}=1,44}

Se a hipótese nula for verdadeira (ou seja, homens e mulheres são escolhidos com igual probabilidade na amostra), a estatística do teste será retirada de uma distribuição qui-quadrada com um grau de liberdade. Embora se possa esperar dois graus de liberdade (um para os homens e uma para as mulheres), devemos ter em conta que o número total de homens e mulheres é limitado (100), e portanto existe apenas um grau de liberdade (2 – 1). Por outras palavras, se a contagem masculina for conhecida, a contagem feminina é determinada, e vice-versa.

Consulta da distribuição qui-quadrado para 1 grau de liberdade mostra que a probabilidade de observar esta diferença (ou uma diferença mais extrema que esta) se homens e mulheres forem igualmente numerosos na população é de aproximadamente 0,23. Esta probabilidade é superior aos critérios convencionais de significância estatística (.001-.05), pelo que normalmente não rejeitaríamos a hipótese nula de que o número de homens na população é o mesmo que o número de mulheres (ou seja, consideraríamos a nossa amostra dentro do intervalo do que esperaríamos para uma relação 50/50 homem/mulher)

Note a hipótese de que o mecanismo que gerou a amostra é aleatório, no sentido de uma selecção aleatória independente com a mesma probabilidade, aqui 0,5 tanto para homens como para mulheres. Se, por exemplo, cada um dos 44 machos seleccionados trouxe um amigo masculino, e cada uma das 56 fêmeas trouxe um amigo feminino, cada um ( O i – E i ) 2 {\textstyle {(O_{i}-E_{i})}^{2}} aumentará por um factor de 4, enquanto cada E i {\textstyle E_{i}} aumentará por um factor de 2. Conhecendo este mecanismo subjacente, devemos, naturalmente, contar pares. Em geral, o mecanismo, se não for defensivamente aleatório, não será conhecido. A distribuição a que a estatística do teste deve ser referida pode, em conformidade, ser muito diferente do qui-quadrado.

Binomial caseEdit

Uma experiência binomial é uma sequência de testes independentes em que os testes podem resultar em um de dois resultados, sucesso ou fracasso. Há n experiências cada uma com probabilidade de sucesso, denotada por p. Desde que npi ≫ 1 para cada i (onde i = 1, 2, …, k), então

Isto tem aproximadamente uma distribuição qui-quadrada com k – 1 graus de liberdade. O facto de existirem k – 1 graus de liberdade é uma consequência da restrição ∑ N i = n {\i} {\i} . Sabemos que existem k – 1 graus de liberdade, no entanto, uma vez que qualquer k – 1 é conhecido, o restante é determinado de forma única. Basicamente, pode-se dizer que existem apenas k – 1 contagens de células livremente determinadas, portanto k – 1 graus de liberdade.

G-testEdit

G-tests são testes de probabilidade-razão de significância estatística que estão a ser cada vez mais utilizados em situações em que os testes de qui-quadrado de Pearson eram previamente recomendados.

A fórmula geral para G é

G = 2 ∑ i O i ⋅ ln ( O i E i ) , {\i}displaystyle G=2\sum _{i}{O_{i}cdot {\i}ln {\i}left(O_frac {i}{E_{i}}{E_{i}},}

∑ i O i = ∑ i E i = N {\i}displaystyle _{i}O_{i}=sum _{i}E_{i}=N}

onde N {\textstyle N} é o número total de observações.

Testes G foram recomendados pelo menos desde a edição de 1981 do popular livro de estatística de Robert R. Sokal e F. James Rohlf.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *