Bondad de ajuste
Los siguientes son ejemplos que surgen en el contexto de los datos categóricos.
Prueba de chi-cuadrado de PearsonEditar
La prueba de chi-cuadrado de Pearson utiliza una medida de bondad de ajuste que es la suma de las diferencias entre las frecuencias de los resultados observados y esperados (es decir, los recuentos de las observaciones), cada una de ellas elevada al cuadrado y dividida por la expectativa:
χ 2 = ∑ i = 1 n ( O i – E i ) E i 2 {\displaystyle \chi ^{2}={suma _{i=1}^{n}{\frac {(O_{i}-E_{i})}{E_{i}^{2}}
Donde:
Oi = un recuento observado para la casilla i Ei = un recuento esperado para la casilla i, afirmado por la hipótesis nula.
La frecuencia esperada se calcula mediante:
E i = ( F ( Y u ) – F ( Y l ) ) N {\displaystyle E_{i},=,{\bigg (}F(Y_{u})},-,F(Y_{l}){\bigg )},N}
Donde:
F = la función de distribución acumulativa para la distribución de probabilidad que se está probando. Yu = el límite superior de la clase i, Yl = el límite inferior de la clase i, y N = el tamaño de la muestra
El valor resultante puede compararse con una distribución chi-cuadrado para determinar la bondad del ajuste. La distribución chi-cuadrado tiene (k – c) grados de libertad, donde k es el número de celdas no vacías y c es el número de parámetros estimados (incluyendo los parámetros de localización y escala y los parámetros de forma) para la distribución más uno. Por ejemplo, para una distribución Weibull de 3 parámetros, c = 4.
Ejemplo: frecuencias iguales de hombres y mujeresEditar
Por ejemplo, para comprobar la hipótesis de que una muestra aleatoria de 100 personas se ha extraído de una población en la que los hombres y las mujeres tienen la misma frecuencia, el número observado de hombres y mujeres se compararía con las frecuencias teóricas de 50 hombres y 50 mujeres. Si hubiera 44 hombres en la muestra y 56 mujeres, entonces
χ 2 = ( 44 – 50 ) 2 50 + ( 56 – 50 ) 2 50 = 1,44 {\displaystyle \chi ^{2}={ 44-50)^{2} \Nsobre 50}+{(56-50)^{2} \más de 50}=1,44}
Si la hipótesis nula es verdadera (es decir, los hombres y las mujeres se eligen con igual probabilidad en la muestra), la estadística de la prueba se extraerá de una distribución chi-cuadrado con un grado de libertad. Aunque cabría esperar dos grados de libertad (uno para los hombres y otro para las mujeres), hay que tener en cuenta que el número total de hombres y mujeres está limitado (100) y, por tanto, sólo hay un grado de libertad (2 – 1). En otras palabras, si se conoce el recuento de hombres se determina el de mujeres, y viceversa.
La consulta de la distribución chi-cuadrado para 1 grado de libertad muestra que la probabilidad de observar esta diferencia (o una diferencia más extrema que ésta) si hombres y mujeres son igualmente numerosos en la población es de aproximadamente 0,23. Esta probabilidad es superior a los criterios convencionales de significación estadística (.001-.05), por lo que normalmente no rechazaríamos la hipótesis nula de que el número de hombres en la población es el mismo que el de mujeres (es decir, consideraríamos nuestra muestra dentro del rango de lo que esperaríamos para una proporción 50/50 de hombres y mujeres.)
Nótese la suposición de que el mecanismo que ha generado la muestra es aleatorio, en el sentido de una selección aleatoria independiente con la misma probabilidad, aquí 0,5 para hombres y mujeres. Si, por ejemplo, cada uno de los 44 varones seleccionados trajera un compañero varón, y cada una de las 56 mujeres trajera una compañera mujer, cada ( O i – E i ) 2 {\textstyle {(O_{i}-E_{i})}^{2}} aumentará en un factor de 4, mientras que cada E i {\textstyle E_{i}} aumentará en un factor de 2. El valor de la estadística se duplicará a 2,88. Conociendo este mecanismo subyacente, deberíamos, por supuesto, contar los pares. En general, el mecanismo, si no es defensivamente aleatorio, no se conocerá. La distribución a la que debe referirse el estadístico de la prueba puede, en consecuencia, ser muy diferente de la chi-cuadrado.
Caso binomialEditar
Un experimento binomial es una secuencia de ensayos independientes en la que los ensayos pueden dar uno de dos resultados, éxito o fracaso. Hay n ensayos cada uno con probabilidad de éxito, denotada por p. Siempre que npi ≫ 1 para cada i (donde i = 1, 2, …, k), entonces
Tiene aproximadamente una distribución chi-cuadrado con k – 1 grados de libertad. El hecho de que hay k – 1 grados de libertad es una consecuencia de la restricción ∑ N i = n {\displaystyle \sum N_{i}=n} . Sabemos que hay k recuentos de células observadas, sin embargo, una vez que se conocen k – 1 cualquiera, el restante está determinado de forma única. Básicamente, se puede decir, que sólo hay k – 1 recuentos de células determinados libremente, por lo tanto, k – 1 grados de libertad.
Prueba GEdit
Las pruebas G son pruebas de cociente de probabilidad de significación estadística que se utilizan cada vez más en situaciones en las que antes se recomendaban las pruebas chi-cuadrado de Pearson.
La fórmula general de G es
G = 2 ∑ i O i ⋅ ln ( O i E i ) , {{displaystyle G=2\i}{O_{i}{cdot \ln \left({\frac {O_{i}}{E_{i}}right)},
donde N {\textstyle N} es el número total de observaciones.
Las pruebas G se recomiendan al menos desde la edición de 1981 del popular libro de texto de estadística de Robert R. Sokal y F. James Rohlf.