Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tema 5 - Contraste de Hipótesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 22

TEMA 5.

CONTRASTE DE HIPÓTESIS

5.1 Formulación de un contraste: tipos de hipótesis, tipos de error, región crítica, función de potencia.

5.2 Contrastes de hipótesis para la media de una población Normal.

5.3 Contraste de hipótesis para la proporción.

5.4 Contrastes de hipótesis para la varianza.

5.5 Contrastes de hipótesis para la diferencia de medias.

5.6 Contraste de hipótesis para la diferencia de proporciones.

5.7 Contrastes de hipótesis para la razón de varianzas.

TEMA 5. CONTRASTE DE HIPÓTESIS Rosa María Espejo Montes

1
INTRODUCCIÓN

Hasta ahora se ha realizado inferencia estadística mediante una aproximación puntual o por intervalos de confianza, Para

obtener el estimador de un parámetro poblacional desconocido, a través de una muestra aleatoria representativa.

Sin embargo, se puede plantear la inferencia desde un punto de vista diferente, se puede “especular” sobre los posibles

valores que puede tener un parámetro (o varios) antes de realizar el estudio estadístico. Posteriormente comparar la hipótesis

planteada a priori con los datos obtenidos en la muestra, y así poder comprobar si estos datos verifican o no la hipótesis

planteada previamente.

La decisión final se tomará para decidir si se mantiene válida la hipótesis formulada sobre el parámetro o por el contrario se

rechazar por ser incomparable con lo observado en la muestra.

La parte de la inferencia estadística que estudia la resolución de problemas bajo esta perspectiva, recibe el nombre de

TEORÍA DEL CONTRASTE (O TEST) DE HIPÓTESIS.

2
INTRODUCCIÓN
Ejemplo:

Supongamos que queremos estudiar el número medio de empleados en las empresas de la provincia de Granada.
¿Qué recursos de los estudiados hasta ahora podemos emplear?

- Estimación puntual de la media de empleados


- Intervalo de confianza para el número medio de empleados en la provincia de Granada.

Existe otra alternativa,

- Formular un contraste de hipótesis. Se pretende comprobar, si el número medio de empleados está


comprendido entre 50 y 60. A partir de la información obtenida en la muestra, se decidirá si dicha
hipótesis es cierta o es insostenible y por tanto, rechazarla por ser falsa.

¿Qué diferencias obtenemos entre el contraste de hipótesis y el resultado mediante intervalo de


confianza?

3
INTRODUCCIÓN
En un contraste de hipótesis, tanto si se rechaza o se acepta una hipótesis, se debe tener en cuenta la posibilidad
que se tiene de cometer errores al tomar cualquiera de los dos posibles resultados.

Ejemplo: Un juez emite la sentencia a un acusado en un juicio. Resolución:

- Culpable, entonces
“Si realmente es culpable el acusado el juez ha acertado en la sentencia. Y ¿si es inocente?”
- Inocente, pero
“Si realmente es inocente el acusado el juez ha acertado en la sentencia. Y ¿si es culpable?”

Ejemplo: Se desea comprobar si el número medio de trabajadores en las empresas de Granada es de 55. Se realizan I.C.

con diferentes tamaños de muestra, ¿qué se puede deducir de los siguientes resultados?

Para: muestra 1 -> I.C. (20, 35), muestra 2 -> I.C.: (50, 60), muestra 3 -> I.C.: (58, 75).

4
DEFINICIÓN DE UN CONTRASTE

Contraste paramétrico: se conoce la distribución de la variable aleatoria bajo estudio y se establecen las hipótesis
sobre los parámetros de dicha distribución, por ejemplo, contrastes para la media, varianza y proporción. (Tema 5)

Contraste no paramétricos: se desconoce la distribución de la variable aleatoria considerada y se establecen las


hipótesis acerca de alguna propiedad de la distribución, por ejemplo, contraste para la homogeneidad. (Tema 6)

En un contraste de hipótesis intervienen siempre dos enunciados excluyentes entre sí:

Hipótesis nula: se representa por H0, y afirma que el verdadero valor de un parámetro se encuentra entre ciertos
valores o que es igual a un cierto valor. Es la hipótesis que se somete a comprobación para ver si es cierta o falsa.

Hipótesis alternativa: se representa por H1, y por el contrario, afirma que el verdadero valor del parámetro se
encuentra fuera del citado conjunto de valores. Es la negación total o parcial de H0.

5
DEFINICIÓN DE UN CONTRASTE
Sea T un estadístico muestral de la variable aleatoria X. Entonces

𝑇∈𝐶 → 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻/
!
𝑇∉𝐶 → 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻/

Al conjunto C se le denomina región crítica o región de rechazo. La región crítica se especifica mediante un
estadístico T que se llama estadístico experimental, considerando siempre un error α, denominado nivel de significación,
(significación teórica).

1-α

Entonces:
α

- La región crítica está formada por todos aquellos valores que toma el estadístico de contraste que llevan a
rechazar a H0.

- La región de aceptación estará entonces formada por aquellos valores que toma el estadístico de contraste que
llevan a aceptar a H0.

6
PASOS PARA LA REALIZACIÓN DE UN CONTASTE DE HIPÓTESIS

1. Fijar la hipótesis nula y su opuesta, la hipótesis alternativa, que pueden ser:

𝐻/ : 𝜃 = 𝜃/ 𝐻/ : 𝜃 ≤ 𝜃/ 𝐻/ : 𝜃 ≥ 𝜃/
𝐻8 : 𝜃 ≠ 𝜃/ 𝐻8 : 𝜃 > 𝜃/ 𝐻8 : 𝜃 < 𝜃/

2. Fijar un nivel de significación (α)

3. Buscar el estadístico adecuado para realizar el contraste. (Formulario)

4. Obtener la región crítica. (Estadístico teórico o p-valor)

5. Obtener el valor observado (Estadístico experimental) del estadístico para la muestra seleccionada.

6. Decidir entre aceptar o rechazar H0.

7
TIPOS DE ERROR
Una vez que se toma la decisión de rechazar o no la hipótesis nula, existe la posibilidad de cometer un error. Pero la

naturaleza del error es diferente según la decisión adoptada:

- Error tipo I: se comete cuando se rechaza la hipótesis nula (es decir, se acepta H1) siendo cierta H0,

α= P(decidir H1 siendo cierta H0 )

- Error tipo II: se comete cuando no rechazamos la hipótesis nula (es decir, se acepta H0) siendo falsa H0.

β= P(decidir H0 siendo cierta H1 )

Las distintas posibilidades resultantes de la verdad o falsedad de la hipótesis nula es:

Tipos de error H0 cierta H0 falsa

Se rechaza H0 Error tipo I Decisión correcta

No se rechaza H0 Decisión correcta Error tipo II

8
TIPOS DE ERROR

Relaciones entre los errores:

1. Toda disminución en el error α (o β) conlleva un aumento del error β (o α).

2. Cuanto más grande es una muestra, más pequeño es el error β para un test con un error α dado, es decir más

fiables son sus conclusiones por H0.

¿Se puede hacer simultáneamente más pequeños α y β?

Todo resultado puede ser significativo (o no significativo) con tal de tomar un error α suficientemente grande (o
pequeño). De ahí que el resultado del test deba venir acompañado del error bajo el cual se obtuvo tal conclusión.

¿Se puede elegir α=0? ¿Qué pasaría?

9
FRASES EQUIVALENTES

Decisión por H1 Decisión por H0

Estadísticamente significativo Estadísticamente no significativo

Se rechaza H0 No se rechaza H0

Se acepta H1 Se acepta H0

La muestra no es compatible con la hipótesis nula La muestra es compatible con la hipótesis nula

El azar no explica la discrepancia entre la muestra y la hipótesis nula El azar puede explicar la discrepancia entre la muestra y la hipótesis
nula

10
CONTRASTE DE HIPÓTESIS

Cuando se acepta H1 la conclusión es fiable, pues la posibilidad de un error α está controlada y es


tan pequeña como se haya querido. Puede ser que la conclusión sea errónea, pero esa posibilidad ha sido
asumida. De concluir H1, no tiene sentido aumentar el tamaño de la muestra, pues el error α sigue siendo el
mismo y lo más probable es que sigamos concluyendo H1.

Cuando se acepta H0 la conclusión no es fiable, pues la posibilidad de error β no está controlada y


puede ser suficientemente grande. Ahora un aumento del tamaño de muestra puede ser conveniente (si H1
es cierta), pues β se hará más pequeño, y será más probable concluir H1.

¿Cómo sé que tengo que aumentar el tamaño de la muestra?

11
P-valor

El p-valor es la significación experimental de los datos, se interpreta como:

- P-valor es el mínimo error α que se debe estar dispuesto a cometer si se desea concluir H1.

- El p-valor mide cómo de raro es lo que ha sucedido si fuera cierta H0.

- El p-valor se entiende como una medida de la disconformidad de los datos con la hipótesis nula, indicando cómo

de improbables son estos si H0 es cierta.

¿Cómo de pequeño debe ser el nivel de significación P para rechazar la H0?

12
REGLA AUTOMÁTICA DE DECISIÓN

Consideramos el nivel de significación teórica, α = 0’05=5% y p el nivel de significación experimental

obtenido a partir de los datos de la muestra. Entonces:

1. Si 𝑃 ≤ 0′05 → decidir H1, hay fuertes evidencias en contra de H0. Test significativo. Se han

encontrado fuertes evidencias en contra de la hipótesis nula.

2. Si 0@ 05 < 𝑃 < 0′15 → no se puede rechazar inmediatamente H0 al existir evidencias en su

contra. Por tanto, conviene aumentar el tamaño de muestra y repetir el test.

3. Si 𝑃 ≥ 0′15 → decidir H0. No hemos encontrado evidencias suficientes en contra de la

hipótesis nula. Test no significativo.

13
PASOS PARA LA REALIZACIÓN PRÁCTICA DE UN CONTRASTE DE HIPÓTESIS

1. Fijar el error α que estamos dispuestos asumir.

2. Calcular el estadístico de contraste Cexp y el p-valor.

3. Concluir si se acepta la hipótesis nula o la hipótesis alternativa:

a. Comparar el estadístico experimental (texp) con estadístico teórico (tteórico ó tα)


correspondiente al error α y que se obtiene a partir de la tabla de distribuciones de probabilidad
adecuada. Entonces decidir:
𝑠𝑖 𝑡CDE ≥ 𝑡∝ → 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻8
𝑠𝑖 𝑡CDE < 𝑡∝ → 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻/

b. Tomar una decisión en función de la regla automática de decisión.

14
Ejemplo para obtener el p-valor:

Se considera una distribución t-Student con 10 grados de libertad y α=0.05.

1. Si texp=2.4 → t0.05=2.228 < texp = 2.40 < t0.02 = 2.764 → 0.02 < P < 0.05 → Aceptar H1

2. Si texp=1.21 → t0.30=1.093 < texp = 1.21 < t0.20 = 2.764 → 0.20 < P < 0.30 → Aceptar H0

3. Si texp=6.33 → t0.001=4.587 < texp = 6.33 → P < 0.001 → Aceptar H1

4. Si texp=0.55 → t0.50=0.7 > texp = 0.05 → P > 0.50 → Aceptar H0

5. Si texp=2.11 → t0.10=1.812 < texp = 2.11 < t0.05 = 2.764 → 0.05 < P < 0.10 → Existen evidencias en

contra de H0, y por ello no se puede aceptar inmediatamente. Hay que aumentar el tamaño de

muestra y repetir el test.

15
CONTRASTE DE HIPÓTESIS SOBRE LA MEDIA DE UNA POBLACIÓN NORMAL

Fijado un nivel de significación, α, se calcula el valor del estadístico

𝑋H − 𝜇 𝑋H − 𝜇/
𝑇= ~𝑡PQ8 → 𝑡CDE =
𝑆N 𝑆N
√𝑛 √𝑛

Región crítica
Contraste
Se rechaza H0 a nivel α si
𝐻/ : 𝜇 = 𝜇/ 𝑡CDE < −𝑡PQ8,8Q∝ o 𝑡CDE > 𝑡PQ8,8Q∝
𝐻8 : 𝜇 ≠ 𝜇/ S S

𝐻/ : 𝜇 ≥ 𝜇/
𝑡CDE < −𝑡PQ8,8Q∝
𝐻8 : 𝜇 < 𝜇/

𝐻/ : 𝜇 ≤ 𝜇/
𝑡CDE > −𝑡PQ8,8Q∝
𝐻8 : 𝜇 > 𝜇/

16
CONTRASTE DE HIPÓTESIS SOBRE LA VARIANZA DE UNA POBLACIÓN NORMAL

Fijado un nivel de significación, α, se calcula el valor del estadístico

(𝑛 − 1)𝑆 V V
(𝑛 − 1)𝑆 V
𝑇= ~𝒳PQ8 → 𝑡CDE =
𝜎V 𝜎/V

Región crítica
Contraste
Se rechaza H0 a nivel α si

𝐻/ : 𝜎2 = 𝜎20 V
𝑡CDE < 𝒳PQ8, ∝ o 𝑡CDE > 𝒳
V

PQ8,8Q
𝐻8 : 𝜎2 ≠ 𝜎20 S S

𝐻/ : 𝜎2 ≥ 𝜎20 V
𝑡CDE < 𝒳PQ8,∝
𝐻8 : 𝜎2 < 𝜎20

𝐻/ : 𝜎2 ≤ 𝜎20 V
𝑡CDE > −𝒳PQ8,∝
𝐻8 : 𝜎2 > 𝜎20

17
CONTRASTE DE HIPÓTESIS SOBRE LA PROPORCIÓN

Fijado un nivel de significación, α, se calcula el valor del estadístico

𝑝̂ − 𝑝 𝑝̂ − 𝑝/
𝑇= ~𝑁(0, 1) → 𝑡CDE =
E(8QE) E] (8QE] )
[ [
P P

Región crítica
Contraste
Se rechaza H0 a nivel α si
𝐻/ : 𝑝 = 𝑝0
𝑡CDE < −𝑍8Q∝ o 𝑡CDE > 𝑍8Q∝
𝐻8 : 𝑝 ≠ 𝑝0 S S

𝐻/ : 𝑝 ≥ 𝑝0
𝑡CDE < −𝑍8Q∝
𝐻8 : 𝑝 < 𝑝0

𝐻/ : 𝑝 ≤ 𝑝0
𝑡CDE > 𝑍8Q∝
𝐻8 : 𝑝 > 𝑝0

18
CONTRASTE DE HIPÓTESIS SOBRE LA DIFERENCIA DE MEDIAS CON VARIANZAS DESCONOCIDAS PERO IGUALES

Fijado un nivel de significación, α, se calcula el valor del estadístico

_ − 𝑌H ) − a𝜇1 − 𝜇2 b
(𝑋 _ − 𝑌H ) − 𝜇0
(𝑋
𝑇= ~𝑡PefQV → 𝑡CDE =
𝑚+𝑛 𝑚+𝑛
𝑆𝑝 [ 𝑆𝑝 [
𝑛𝑚 𝑛𝑚

Región crítica
Contraste
Se rechaza H0 a nivel α si
𝐻/ : 𝜇8 − 𝜇V = 𝜇/ 𝑡CDE < −𝑡PefQV,8Q∝ o 𝑡CDE > 𝑡PefQV,8Q∝
𝐻8 : 𝜇8 − 𝜇V ≠ 𝜇/ S S

𝐻/ : 𝜇8 − 𝜇V ≥ 𝜇/
𝑡CDE < −𝑡PefQV,8Q∝
𝐻8 : 𝜇8 − 𝜇V < 𝜇/

𝐻/ : 𝜇8 − 𝜇V ≤ 𝜇/
𝑡CDE > −𝑡PefQV,8Q∝
𝐻8 : 𝜇8 − 𝜇V > 𝜇/

19
CONTRASTE DE HIPÓTESIS SOBRE LA DIFERENCIA DE MEDIAS CON VARIANZAS CONOCIDAS

Fijado un nivel de significación, α, se calcula el valor del estadístico

(_ H ) − a𝜇1 − 𝜇2 b
𝑋−𝑌 _ − 𝑌H ) − 𝜇0
(𝑋
𝑇= ~𝑁(0, 1) → 𝑡CDE =
𝜎21 𝜎22 2 2
[ + [𝜎1 + 𝜎2
𝑛 𝑚 𝑛 𝑚

Región crítica
Contraste
Se rechaza H0 a nivel α si
𝐻/ : 𝜇8 − 𝜇V = 𝜇/ 𝑡CDE < −𝑍8Q∝ o 𝑡CDE > 𝑍8Q∝
𝐻8 : 𝜇8 − 𝜇V ≠ 𝜇/ S S

𝐻/ : 𝜇8 − 𝜇V ≥ 𝜇/
𝑡CDE < −𝑍8Q∝
𝐻8 : 𝜇8 − 𝜇V < 𝜇/

𝐻/ : 𝜇8 − 𝜇V ≤ 𝜇/
𝑡CDE > 𝑍8Q∝
𝐻8 : 𝜇8 − 𝜇V > 𝜇/

20
CONTRASTE DE HIPÓTESIS SOBRE EL COCIENTE DE VARIANZAS

Fijado un nivel de significación, α, se calcula el valor del estadístico

𝑆2𝑛−1 𝜎22 𝑆2𝑛−1 𝜎22


𝑇 = 2 ∙ 2 ~𝐹PQ8,fQ8 → 𝑡CDE = 2 𝑐𝑜𝑛 𝐶 = 2
𝑆𝑚−1 𝜎1 𝑆𝑚−1 𝜎1

Región crítica
Contraste
Se rechaza H0 a nivel α si
𝐻/ : 𝐶 = 1 𝑡CDE < 𝐹fQ8,PQ8,8Q∝ o 𝑡CDE > 𝐹PQ8,fQ8,8Q∝
𝐻8 : 𝐶 ≠ 1 S S

𝐻/ : 𝐶 ≥ 1 𝑡CDE < 𝐹fQ8,PQ8,8Q∝


𝐻8 : 𝐶 < 1 S

𝐻/ : 𝐶 ≤ 1 𝑡CDE > 𝐹PQ8,fQ8,8Q∝


𝐻8 : 𝐶 > 1 S

21
CONTRASTE DE HIPÓTESIS SOBRE LA DIFERENCIA DE PROPORCIONES

Fijado un nivel de significación, α, se calcula el valor del estadístico

(𝑃1 − 𝑃2 ) − a𝑝1 − 𝑝2 b (𝑃j 1 − 𝑃j 2 ) − 𝑃0


𝑇= ~𝑁 (0, 1) → 𝑡CDE =
𝑃1 (1−𝑃1 ) 𝑃2 (1−𝑃2 ) j (1−𝑃j 1 ) j 2 (1−𝑃j 2 )
[ + [𝑃1 +
𝑃
𝑛 𝑚 𝑛 𝑚

Región crítica
Contraste
Se rechaza H0 a nivel α si
𝐻/ : 𝜇8 − 𝜇V = 𝜇/ 𝑡CDE < −𝑍8Q∝ o 𝑡CDE > 𝑍8Q∝
𝐻8 : 𝜇8 − 𝜇V ≠ 𝜇/ S S

𝐻/ : 𝜇8 − 𝜇V ≥ 𝜇/
𝑡CDE < −𝑍8Q∝
𝐻8 : 𝜇8 − 𝜇V < 𝜇/

𝐻/ : 𝜇8 − 𝜇V ≤ 𝜇/
𝑡CDE > 𝑍8Q∝
𝐻8 : 𝜇8 − 𝜇V > 𝜇/

22

También podría gustarte