Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Prueba Ji Cuadrado de Homogeneidad. Ejemplo

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

Prueba Ji-cuadrado de Homogeneidad:

Objetivo de la prueba: se utiliza cuando se tienen varias muestras independientes de n


individuos que se cl asifican respecto a una variable cualitativa y se desea conocer a
partir de datos muestrales, si provienen de la misma población (el objetivo es comparar
diferentes muestras).

Es decir, en esta prueba se tienen varias muestras independientes correspondientes a las


categorías de una de las variables y se cl asifican las observaciones respecto a l a otra
variable. La prueba tiene la finalidad de conocer si la distribución de la variable
estudiada difiere en las “r" poblaciones subyacentes de las cuales se obtuvieron las
muestras.

Hipótesis:
H0: P11 = P12 (hay homogeneidad entre los grupos respecto a l as categorías de la
variable (hay igualdad entre la proporción de elementos de cada grupo que caen en la
misma categoría de la variable).
H1: P11 ≠ P12 (no hay homogeneidad (la proporción de elementos de cada grupo que
caen en la misma categoría de la variable difieren)

Puede plantearse otra hipótesis:


H0: No difiere la distribución de la variable estudiada en las poblaciones de las cuales se
obtuvieron las muestras.
H1: Difiere la distribución de la variable estudiada en las poblaciones de las cuales se
obtuvieron las muestras.

En las tablas 2x2 se emplea la prueba Ji-cuadrado Corrección de Yates siempre (como
puede verse el estadígrafo es el mismo que para la prueba de Independencia).

Limitaciones de la prueba (las mismas que para la prueba de Independencia):

-Se necesita que más del 20 % de los valores esperados estén por encima de 5 y q ue
ninguna celda tenga valor esperado menor a 1.

-Si la tabla es de 2x2, todas las celdas deben tener valores esperados por encima de 5.

-En el caso de la tabla de 2x2 si existe una sola celda con valor esperado menor que 5,
esto representaría un 25 % de las celdas con esa condición, por lo que se utilizaría la
Prueba de las Probabilidades exactas de Fisher en lugar de la Prueba χ2, ya que en éste
caso no es posible agrupar categorías.

El estadígrafo de prueba y la regla de decisión son similares a los de la Prueba Ji-


cuadrado de independencia.

Aspectos que diferencian a las Prueba de 2 de Independencia y a la Prueba de 2


de Homogeneidad:
 Tipo de muestreo
 Número de muestras
 Hipótesis a contrastar
 Conclusiones

Tipo de
Prueba # de muestras Usos
muestreo
Probar la hipótesis nula según la
cual en la población existe
Independencia Transversal Una muestra
independencia entre los dos
criterios de clasificación.
Probar la hipótesis nula de que
Cohorte o 2 o más muestras, en las muestras extraídas provienen
Homogeneidad Casos general f muestras de una población homogénea
Control independientes según algún criterio de
clasificación.

Errores más frecuentes en el uso de las Pruebas de Independencia y


Homogeneidad:
• No inspeccionar los datos antes de realizar cualquier prueba de hipótesis.
• Clasificar una variable cuantitativa en su naturaleza con una escala de menor para
poder realizar la prueba.
• Utilizar la prueba cuando una de las variables es cualitativa ordinal (en ese caso se
emplea la Ji-cuadrado Tendencia Lineal).
• Usar el estadístico como una medida de asociación (estas pruebas son de
significación de asociación y no dan una medida de asociación, solo permiten
identificar si existe o no a sociación pero no c uantifican la magnitud de esa
asociación en caso de que exista).
• Usar la prueba cuando se dispone de valores promedios o porcentajes (la prueba
solo puede realizarse con las frecuencias observadas, no con medidas de resumen).
• En las tablas FxC: no se debe utilizar la prueba cuando más del 20% de las celdas
tienen frecuencias esperadas menores que 5 o al menos 1 de las celdas tiene
frecuencia esperada inferior a 1.
• En las tablas 2x2: no se debe utilizar la prueba cuando una frecuencia esperada es
menor que 5. En ese caso debe realizarse la Prueba de Fisher-Irwin o de
probabilidad exacta de Fisher.

Ejemplo: Con la finalidad de evaluar el hábito de fumar como factor de riesgo del
cáncer del pulmón, se seleccionan 2 muestras aleatorias, una de pacientes con esta
enfermedad y l a otra de personas sin esta condición. A continuación se brinda la
información obtenida:

Cáncer de pulmón
Hábito de fumar Sí No Total
Presente 11 13 24
Ausente 10 46 56
Total 21 59 80
Considere un α=0,05.

Hipótesis:

H0: Hay homogeneidad entre los enfermos y no enfermos de cáncer del pulmón respecto
a fumar o no fumar (la proporción de fumadores es similar en enfermos y no enfermos)
H1: No hay homogeneidad (la proporción de fumadores difiere en enfermos y no
enfermos)

Se introducen los datos en el programa de la siguiente forma:


Es decir, se tienen dos variables: habito_fumar y cancer_pulmon donde se codificarán
de la siguiente forma:
-habito_fumar: tiene dos categorías: Presente (se codifica con el número 1) y Ausente
(que se codifica con el número 2).
-cancer_pulmon: tiene dos categorías: Sí (que se codifica con el número 1) y No (que se
codifica con el número 2).
Quedará así en la Vista de variables:

Luego vamos al menú Analizar, Estadísticos descriptivos, Tablas de contingencia y


daremos clic en Tablas de contingencia. Debe quedarles así:

Luego saldrá el siguiente cuadro de diálogo:


Ahora daremos un c lic en la variable Hábito de fumar para activarla y la pasaremos
hacia el cuadro que dice Filas: y luego daremos un clic en la variable Cáncer de pulmón
para activarla y la pasaremos hacia el cuadro que dice Columnas:. Luego debe quedarles
así:

Después en el botón Estadísticos que queda a la derecha y arriba de ese cuadro de


diálogo anterior daremos clic y saldrá el siguiente cuadro de diálogo:
Ahí daremos un clic para activar el cuadrito que está delante de donde dice Chi-
cuadrado y luego daremos clic en el botón de abajo donde dice Continuar. Debe
quedarles así:

Ahora volvemos al cuadro de diálogo anterior y daremos clic en el botón Aceptar y


saldrán los siguientes resultados:
Resultados:

Tablas de contingencia
[Conjunto_de_datos2] D:\0-Bioestadistica\13-Pruebas en SPSS\Pruebas no
paramétricas\Ji-cuadrado\3-Homogeneidad\1-Base de datos. Prueba Ji-
cuadrado de Homogeneidad.sav
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Hábito de fumar * Cáncer 80 100,0% 0 0,0% 80 100,0%
de pulmón

Tabla de contingencia Hábito de fumar * Cáncer de pulmón


Recuento
Cáncer de pulmón Total
Sí No
Presente 11 13 24
Hábito de fumar
Ausente 10 46 56
Total 21 59 80
Pruebas de chi-cuadrado
Valor gl Sig. asintótica Sig. exacta Sig. exacta
(bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 6,792a 1 ,009
Corrección por continuidadb 5,424 1 ,020
Razón de verosimilitudes 6,448 1 ,011
Estadístico exacto de Fisher ,013 ,011
Asociación lineal por lineal 6,707 1 ,010
N de casos válidos 80
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 6,30.
b. Calculado sólo para una tabla de 2x2.

Interpretación:

Vemos en la tabla titulada Resumen del procesamiento de los casos estudiados donde se
observa que el 100 % de los casos (80) fueron válidos.

Vemos en la tabla titulada Tabla de contingencia Hábito de fumar * Cáncer de pulmón


el recuento de los casos que pertenecen a cada categoría de las dos variables de estudio.

La tabla titulada Pruebas de chi-cuadrado nos muestra el valor del estadígrafo


Corrección por continuidad ya que se trata de una tabla 2x2, cuyo valor fue de 5,424,
con un grado de libertad. El valor de p (Sig. asintótica (bilateral)) fue de 0,020 y como
es menor de 0,05 y debajo de esa tabla se especifica que existen “0 casillas (0,0%)
tienen una frecuencia esperada inferior a 5. L a frecuencia mínima esperada es 6 ,30”
entonces se rechaza la hipótesis nula de no diferencias entre las proporciones, por lo que
se llega a la conclusión que existen diferencias estadísticas significativas entre enfermos
de cáncer del pulmón y libres de la enfermedad en relación a la distribución de
fumadores y no fumadores, con un nivel de significación del 5%.

También podría gustarte