PRUEBAS CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA
Como ya se ha visto varias veces, los resultados obtenidos de muestras no siempre concuerdan exactamente con los resultados teóricos esperados, según las reglas de probabilidad. Por ejemplo, aunque consideraciones teóricas conduzcan a esperar 50 caras y 50 cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se obtengan exactamente estos resultados.
Supóngase que en una determinada muestra se observan una serie de posibles sucesos E
1, E
2, E
3, . . . , E
K, que ocurren con frecuencias o
1, o
2, o
3, . . ., o
K, llamadas
frecuencias observadas y que, según las reglas de probabilidad, se espera que ocurran con frecuencias e
1, e
2, e
3, . . . ,e
Kllamadas
frecuencias teóricas o esperadas.
A menudo se desea saber si las frecuencias observadas difieren significativamente de las frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E
1 y E
2 como, por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto satisfactoriamente con los métodos de las unidades anteriores. En esta unidad se considera el problema general.
Definición de X
2
Una medida de la discrepancia existente entre las frecuencias observadas y esperadas es suministrada por el estadístico X
2, dado por:
donde si el total de frecuencias es N,
Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente, mientras que si X2>0, no coinciden exactamente. A valores mayores de X2, mayores son las discrepancias entre las frecuencias observadas y esperadas.
Si las frecuencias esperadas son al menos iguales a 5, la aproximación mejora para valores superiores.
El número de grados de libertad
está dado por:
= k – 1 – m
en donde:
K = número de clasificaciones en el problema.
m = número de parámetros estimados a partir de los datos muestrales para obtener los valores esperados.
En la práctica, las frecuencias esperadas se calculan de acuerdo con la hipótesis H
o. Si bajo esta hipótesis el valor calculado de X
2 dado es mayor que algún valor crítico, se deduce que las frecuencias observadas difieren
significativamente de las esperadas y se rechaza H
o al nivel de significación correspondiente. En caso contrario, no se rechazará. Este procedimiento se llama
ensayo o
prueba de chi-cuadrado de la hipótesis.
Debe advertirse que en aquellas circunstancias en que X
2 esté
muy próxima a cero debe mirarse con cierto recelo, puesto que es raro que las frecuencias observadas concuerden demasiado bien con las esperadas. Para examinar tales situaciones, se puede determinar si el valor calculado de X
2 es menor que las X
2 críticas o de tabla (ensayo unilateral izquierdo), en cuyos casos se decide que la concordancia es
bastante buena.
Ejemplos:
- La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hipótesis de que el dado está bien hecho al nivel de significación del 0.05.
Cara
|
1
|
2
|
3
|
4
|
5
|
6
|
| Frecuencia Observada |
25
|
17
|
15
|
23
|
24
|
16
|
Solución:
Ensayo de Hipótesis:
Ho; Las frecuencias observadas y esperadas son significativamente iguales
(dado bien hecho)
H1; Las frecuencias observadas y esperadas son diferentes (dado cargado).
Primero se procede a calcular los valores esperados. Como es bien sabido por todos la probabilidad de que caiga cualquier número en un dado no cargado es de 1/6. Como la suma de los valores observados es de 120, se multiplica este valor por 1/6 dando un resultado de 20 para cada clasificación.
Cara
|
1
|
2
|
3
|
4
|
5
|
6
|
Total
|
| Frecuencia Observada |
25
|
17
|
15
|
23
|
24
|
16
|
120
|
| Frecuencia esperada |
20
|
20
|
20
|
20
|
20
|
20
| |
Grados de libertad = k-1-m = 6-1-0 = 5
No se tuvo que calcular ningún parámetro para obtener las frecuencias esperadas.
Regla de decisión:
Si X2R
11.1 no se rechaza Ho.
Si X2R >11.1 se rechaza Ho.
Cálculos:

Justificación y decisión:
Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una significación de 0.05 que el dado está bien hecho.
Informacion tomada de: