Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Ji Cuadrada

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

Ji- cuadrado

Supongamos que un investigador está interesado en evaluar la asociación entre


uso de cinturón de seguridad en vehículos particulares y el nivel socioeconómico
del conductor del vehículo. Con este objeto se toma una muestra de conductores a
quienes se clasifica en una tabla de asociación, encontrando los siguientes
resultados:

 
Uso de Nivel Nivel Nivel TOTAL
cinturó socioeconómic socioeconómic socioeconómic
n o bajo o medio o alto
SI 8 15 28 51
NO 13 16 14 43
TOTAL 21 31 42 94

Tabla I. Tabla de asociación, valores observados.

¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del
nivel socioeconómico? Usaremos un nivel de significación alfa=0,05.

Los pasos del análisis estadístico en este caso son los siguientes:

1. En primer lugar se debe plantear las hipótesis que someteremos a prueba

H0: “El uso de cinturón de seguridad es independiente del nivel socioeconómico”.


H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.

En esta prueba estadística siempre la hipótesis nula plantea que las variables
analizadas son independientes.

2. En segundo lugar, obtener (calcular) las frecuencias esperadas

Estas son las frecuencias que debieran darse si las variables fueran
independientes, es decir, si fuera cierta la hipótesis nula.

Las frecuencias esperadas se obtendrán de la distribución de frecuencias del total


de los casos, 51 personas de un total de 94 usan el cinturón y 43 de 94 no lo usan.
Esa misma proporción se debería dar al interior de los tres grupos de nivel
socioeconómico, de manera que el cálculo responde al siguiente razonamiento: si
de 94 personas 51 usan cinturón; de 21 personas, ¿cuántas debieran usarlo?

La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4.


Este procedimiento debe repetirse con todas las frecuencias del interior de la
tabla.
El detalle de los cálculos es el siguiente:

Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6


Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2
Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2

Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera
verdadera y, por consiguiente, las variables fueran independientes.

Estos valores los anotamos en una tabla con las mismas celdas que la anterior;
así tendremos una tabla con los valores observados y una tabla con los valores
esperados, que anotaremos en cursiva, para identificarlos bien.

Uso de Nivel Nivel


Nivel medio TOTAL
cinturón bajo alto
SI 11,4 16,8 22,8 51
NO 9,6 14,2 19,2 43
TOTAL 21 31 42 94

Tabla II. Tabla de asociación, valores esperados.

3. En tercer lugar se debe calcular el estadístico de prueba

En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al


comienzo, compara las frecuencias que entregan los datos de la muestra
(frecuencias observadas) con las frecuencias esperadas, y tiene la siguiente
fórmula cálculo:

 donde oi  representa a cada frecuencia observada y ei representa a cada


frecuencia esperada.

De este modo el valor del estadístico de prueba para este problema será:

Entonces   Este es el valor de nuestro estadístico de prueba que ahora,


siguiendo el procedimiento de problemas anteriores (paso 4), debemos comparar
con un valor de la tabla de probabilidades para ji-cuadrado (x2). Esta tabla es muy
parecida a la tabla t de student, pero tiene sólo valores positivos porque ji-
cuadrado sólo da resultados positivos. Véase gráfico 1, que muestra la forma de la
curva, con valores desde 0 hasta infinito.
 

Gráfico 1.

Dado que el estadístico ji cuadrado sólo toma valores positivos, la zona de


rechazo de la hipótesis nula siempre estará del lado derecho de la curva.

Uso de tabla ji-cuadrado

La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la


primera fila la probabilidad asociada a valores mayores a un determinado valor del
estadístico (véase gráfico de la tabla III).
Los grados de libertad dependen del número de celdas que tiene la tabla de
asociación donde están los datos del problema y su fórmula de cálculo es muy
sencilla:

Grados de libertad (gl)=(nº de filas–1)x(nº de columnas–1)

Así, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad
serán:

gl=(2-1)x(3-1)=2

Nótese que no se consideran la fila ni la columna de los totales.


 
Tabla III. Tabla de ji-cuadrado.

Al comienzo elegimos un nivel de significación alfa=0,05. Entonces un valor de


tabla para x2 asociado a 2 grados de libertad y alfa 0,05 es 5,99.

Por lo tanto, como en el gráfico 2 vemos que 5,23 se encuentra a la izquierda de


5,99, la probabilidad asociada a valores superiores a 5,23 es mayor que alfa
(0,05).
 
Gráfico 2.

Según esto, debemos aceptar la hipótesis nula que plantea que las variables “uso
de cinturón de seguridad” y “nivel socioeconómico” son independientes.
Limitación: como norma general, se exige que el 80% de las celdas en una tabla
de asociación tengan valores esperados mayores de 5.

Ji-cuadrado como prueba de bondad de ajuste

También se puede usar el estadístico ji-cuadrado para evaluar cuán buena puede
resultar una distribución teórica, cuando pretende representar la distribución real
de los datos de una muestra determinada. A esto se le llama evaluar la bondad
de un ajuste. Probar la bondad de un ajuste es ver en qué medida se ajustan los
datos observados a una distribución teórica o esperada.

Tomemos como ejemplo la distribución esperada para los individuos de una


población que son clasificados según grupo sanguíneo. Según estudios realizados
en población, se espera que dicha distribución, en porcentajes, sea la siguiente:

Grup
Frecuencia esperada
o
AB 2,0%
A 30,5%
B 9,3%
0 58,2%

Tabla IV. Ejemplo de distribución esperada.

En una muestra de 150 dadores de sangre se encontró la siguiente distribución:

Grupo Frecuencia observada


AB 4
A 48
B 15
0 83
Tabla V. Ejemplo de distribución observada.

1. Las hipótesis del problema son:

H0: los datos se ajustan a la distribución teórica.


H1: los datos no se ajustan a la distribución teórica.

2. Siguiendo el esquema general de solución propuesto para las pruebas de


hipótesis, ahora corresponde elegir un nivel de significación

Elegimos entonces alfa=0,01. El estadístico de prueba será ji-cuadrado, cuya


fórmula es:

Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos los


porcentajes esperados a la muestra de 150 casos podemos obtener las siguientes
frecuencias esperadas (ei):

Grupo Frec. oi Frec. ei


AB 4 3,00
A 48 45,75
B 15 13,95
0 83 87,30
Total 150 150,00

Tabla VI. Ejemplo de frecuencias esperadas.

Los grados de libertad de esta tabla se obtienen restando 1 al número de filas, en


este caso: gl=4-1=3
Recordemos que la fila del total no se considera para los grados de libertad.

Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a


evaluar la diferencia entre ellas utilizando el estadístico ji-cuadrado. Si la diferencia
entre frecuencias observadas y esperadas es grande, significará que la hipótesis
nula es falsa, o sea, esta distribución no se ajusta a la distribución teórica y si, en
cambio, resulta que la diferencia entre frecuencias observadas y esperadas no es
muy grande, significará que la hipótesis nula es verdadera; por lo tanto, la
distribución en la muestra se ajusta a la distribución teórica y diremos que no hay
significación estadística.

El valor del estadístico de prueba (x2) es una medida de la diferencia entre


frecuencias observadas y esperadas; por lo tanto, mientras mayor resulte  , más
fácil será rechazar la hipótesis nula.
3. Se calcula el estadístico de prueba con los datos del ejemplo

4. Se compara este valor con el valor de ji-cuadrado de la tabla

El valor de ji-cuadrado lo buscaremos con alfa=0,01 y 3 grados de libertad. Según


tabla, ese valor es 11,34.
Al comparar el valor del estadístico de prueba (0,73) con el valor de tabla (11,34),
vemos que 0,73 se encuentra a la izquierda de 11,34 desplazado hacia el centro
de la curva y que, por lo tanto, la probabilidad de valores mayores a él es muy
superior al nivel de significación alfa=0,01.

5. Conclusión

Dado que la probabilidad de  es mayor que alfa, se acepta la hipótesis


nula. Esto significa que los datos observados se ajustan a la distribución teórica,
por lo tanto las diferencias observadas no son estadísticamente significativas.

6. Gráfico

También podría gustarte