Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

ppt#8

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 38

“R: Contraste de Hipótesis”

M.Sc. Henry Luis López García


Maestría en Economía y Finanzas
@Hen1985 hlopez@unan.edu.ni
Contenido
• Conceptos básicos
• Prueba de hipótesis relacionada con una sola
media
• Varianza conocida
• Varianza desconocida
Conceptos básicos
• Tipos de estudios según diseño metodológicos
1. Descriptivos
2. Correlacional
3. Analíticos (experimentales y cuasiexperimentales)
• Tipo de estudio según métodos estadísticos
1. Estudios exploratorios
2. Estudios confirmatorios
Conceptos básicos
• Una Hipótesis Estadística es una afirmación o conjetura
acerca de una o más poblaciones.
• Una prueba de hipótesis (o prueba de significancia) es un
procedimiento para someter a prueba una afirmación
acerca de una propiedad de una población.
• Hipótesis Nula : consiste generalmente en una afirmación
concreta sobre la forma de una distribución de
probabilidad o sobre el valor de alguno de los parámetros
de esa distribución. El nombre de “nula” significa “sin
valor, efecto o consecuencia”, partiendo siempre de la
igualdad (indicando lo contrario a la alternativa).
Conceptos básicos
• Hipótesis Alternativa :La hipótesis H1 es la negación
de la nula. En la forma simbólica de la hipótesis
alternativa debe emplear alguno de estos símbolos:
<, >, o bien, ≠.
Estadísticos de prueba
,

,
• Para la

•Para la , proporción
Herramientas para evaluar el
estadístico de prueba
•La región crítica (o región de rechazo) es el conjunto de todos los valores del
estadístico de prueba que pueden provocar que rechacemos la hipótesis
nula.

•El nivel de significancia (denotado con 𝛼) es la probabilidad de que el


estadístico de prueba caiga en la región crítica, cuando la hipótesis nula es
verdadera. Si el estadístico de prueba cae en la región crítica, rechazamos la
hipótesis nula, de manera que 𝛼 es la probabilidad de cometer el error de
rechazar la hipótesis nula cuando es verdadera.

•Un valor crítico es cualquier valor que separa la región crítica (donde
rechazamos la hipótesis nula) de los valores del estadístico de prueba que
no conducen al rechazo de la hipótesis nula. Los valores críticos dependen
de la naturaleza de la hipótesis nula, de la distribución muestral que se
aplique y del nivel de significancia 𝛼.

a)
Signo usado en H1: < Prueba de cola izquierda

H 1=μ < μ0
∝ ∝
2 2

b)
Signo usado en H1: Prueba de dos colas

H 1=μ ≠ μ0
1− ∝

c)
Signo usado en H1: > Prueba de cola derecha

H 1=μ > μ0
Procedimientos para la prueba de
hipótesis
•Establecer la hipótesis nula de que θ= .

•Seleccionar una hipótesis alternativa apropiada de una de las alternativas θ < , θ


> oθ≠.

•Seleccionar un nivel de significancia de tamaño ∝.

•Seleccionar el estadístico de prueba apropiado y establecer la región critica. (si la


decisión se va a basar en un valor P no es necesario establecer la región critica).

•Calcular el valor del estadístico de prueba de los datos muestrales.

•Decidir: Rechazar si el estadístico de prueba tiene un valor en la región critica (o si


el valor de P es menor o igual que el nivel de significancia deseado ∝); de otra
forma no rechazar la .
Ejercicio 1
• Una muestra aleatoria de 100 muertes registradas
en los Estados Unidos durante el año pasado
mostro una vida promedio de 71.8 años.
Suponiendo una desviación estándar poblacional
de 8.9 años, ¿parecería esto indicar que la vida
promedio hoy en día es mayor que 70 años? Utilice
un nivel de significancia del 0.05.
Ejemplo 1
install.packages("BSDA")
library(BSDA)
zsum.test(
mean.x=71.8,
sigma.x =8.9,
n.x = 100,
mean.y = NULL,
sigma.y = NULL,
n.y = NULL,
alternative ="greater",
mu = 70,
conf.level = 0.95
)
Ejercicio 2
• Un fabricante de equipo deportivo ha desarrollado un nuevo
sedal sintético para pesca que se considera tiene una
resistencia a la ruptura de 8 kilogramos con una desviación
estándar de 0.5 kilogramos. Pruébese la hipótesis de que
kilogramos, en contra oposición a la alternativa de que
kilogramos si se prueba una muestra aleatoria de 50 sedales y
se encuentra que tiene una resistencia promedio a la ruptura
de 7.8 kilogramos. Utilice un nivel de significancia del 0.01.
Ejemplo 2
zsum.test(
mean.x=7.8,
sigma.x =0.5,
n.x = 50,
mean.y = NULL,
sigma.y = NULL,
n.y = NULL,
alternative ="two.sided",
mu = 8,
conf.level = 0.99
)
Ejercicio 3
• El Instituto Eléctrico Edison publica cifras del número anual de kilowatts-hora
que gastan varios aparatos electrodomésticos. Se afirma que una aspiradora
gasta un promedio de 46 kilowatts-hora al año. Si una muestra aleatoria de 12
hogares que se incluye en un estudio planeado indica que las aspiradoras gastan
un promedio de 42 kilowatts-hora al año con una desviación estándar de 11.9
kilowatts-hora, ¿en un nivel de significancia de 0.05 esto sugiere que las
aspiradoras gastan, en promedio, menos de 46 kilowatts-hora anualmente?
Suponga que la población de kilowatts-hora es normal.
Ejemplo 3

zsum.test(
mean.x=42,
sigma.x =11.9,
n.x = 12,
mean.y = NULL,
sigma.y = NULL,
n.y = NULL,
alternative ="less",
mu = 46,
conf.level = 0.975
)
Ejercicio 4
• Debería ser de interés para el lector ver resultados por computadora
comentados que muestren el resultado de una prueba t de una sola muestra.
Suponga que un ingeniero se interesa en probar el sesgo en un medidor de pH.
Se reúnen datos de una sustancia neutra (pH = 7.0). Se toma una muestra de las
mediciones y los datos son los siguientes: 7.07 7.00 7.10 6.97 7.00 7.03 7.01
7.01 6.98 7.08. Utilice un nivel de significancia de 0.07 y suponga que la
distribución del contenido es normal.
Ejemplo 4

y<- c(7.07, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08)

tsum.test(mean.x=mean(y),s.x=sd(y),n.x=length(y),mu=7.0,
alternative="two.sided",conf.level=0.93)
Ejercicio 5
• Pruebe la hipótesis de que el contenido promedio de los envases de un
lubricante especifico es de 10 litros, si los contenidos de una muestra aleatoria
de 10 envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros.
Utilice un nivel de significancia de 0.01 y suponga que la distribución del
contenido es normal.
Ejercicio 6
• Pruebe la hipótesis de que el contenido promedio de los envases de un
lubricante especifico es de 10 litros, si los contenidos de una muestra aleatoria
de 10 envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros.
Utilice un nivel de significancia de 0.01 y suponga que la distribución del
contenido es normal.
Ejercicio 7
• La experiencia indica que el tiempo para que los estudiantes de último año de
preparatoria terminen un examen estandarizado es una variable aleatoria
normal con una media de 35 minutos. Si a una muestra aleatoria de 20
estudiantes de último año de preparatoria le toma un promedio de 33.1
minutos completar dicho examen con una desviación estándar de 4.3 minutos,
con un nivel de significancia de 0.025, pruebe la hipótesis de que μ = 35 minutos
contra la alternativa de que μ < 35 minutos.
Ejercicio 8
• Se afirma que un automóvil se maneja en promedio más de 20,000 kilómetros
por año. Para probar tal afirmación, se pide a una muestra de 100 propietarios
de automóviles que lleven un registro de los kilómetros que recorran. ¿Estaría
usted de acuerdo con esta afirmación, si la muestra aleatoria mostró un
promedio de 23,500 kilómetros y una desviación estándar de 3900 kilómetros?
Utilice un valor P en su conclusión.
Prueba de
• Comparación de dos tratamientos: Un problema
frecuente es comparar la media de dos tratamientos,
como por ejemplo dos materiales, dos máquinas o
dos métodos de trabajo incluso dos fármacos.

Figura 1.Comparación de dos tratamientos


Prueba de
• Suposición de varianzas desconocidas, sean dos
procesos o tratamientos con y varianzas
respectivamente. Interesa investigar si las medias de
dichos procesos pueden considerarse
estadísticamente iguales, para ello se plantea la
siguiente hipótesis:

𝐻 0 :𝜇 𝑥=𝜇 𝑦 ↔ 𝐻 0 :𝜇 𝑥 − 𝜇 𝑦 =0
Prueba de
• Como se toman dos muestras aleatorias de tamaño la del
proceso y la del proceso , si para cada proceso sigue una
distribución normal y son independientes entre ellos, el
estadístico de prueba adecuado para probar la hipótesis de
igualdad de medias esta dada por:
𝑥 −𝑦
𝑡0 =
𝑠𝑝
√ 1 1
+
𝑛𝑥 𝑛𝑦
• Al igual que sigue una distribución de con grados de libertad,
donde es un estimador de la varianza muestral común.
Prueba de
• Suponiendo que dichas varianzas desconocidas sean
iguales, y se calcula como:

( 𝑛𝑥 −1 ) 𝑠 𝑥 2 + ( 𝑛 𝑦 −1 ) 𝑠 𝑦 2
𝑠 2𝑝 =
𝒏 𝒙 +𝒏 𝒚 −𝟐
• Con y las varianzas muestrales de los datos de
cada proceso.
Marco de datos “sleep”
• Datos que muestran el efecto de dos fármacos
soporíferos (aumento de horas de sueño en
comparación con el control) en 10 pacientes.
• Un marco de datos con 20 observaciones sobre 3
variables.
• [, 1] aumento numérico adicional de horas de
sueño.
• [, 2] fármaco de factor de grupo administrado.
• [, 3] ID del paciente del factor de identificación.
Prueba de
Usaremos el conjunto de datos incorporado “sleep”
Comparación de dos grupos: prueba t independientes de dos muestras
> data()
> data("sleep") # datos del sueño
> View(sleep)

> dormi_bien <- data.frame(


ID=1:10,
group1=sleep$extra[1:10],
group2=sleep$extra[11:20])
Prueba de
> t.test(extra~group,sleep)
Welch Two Sample t-test
data: extra by group
t = -1.8608, df = 17.776, p-value = 0.07939
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.3654832 0.2054832
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
Prueba de
> t.test(dormi_bien$group1, dormi_bien$group2)
Welch Two Sample t-test
data: dormi_bien$group1 and dormi_bien$group2
t = -1.8608, df = 17.776, p-value = 0.07939
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
- 3.3654832 0.2054832
sample estimates:
mean of x mean of y
0.75 2.33
Prueba de
Por defecto, t.test no suponen varianzas iguales; en lugar de la
prueba t de Student, utiliza la prueba t de Welch de forma
predeterminada. Tenga en cuenta que en la prueba t de Welch,
gl = 17,776, debido al ajuste por varianzas desiguales. Para
usar la prueba t de Student, configure var.equal=TRUE.
> t.test(extra~group, sleep, var.equal=TRUE)
Prueba de
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
Prueba de
Prueba t de muestras pareadas (dependiente)
Ordenando por grupo y luego por ID
> sleep <- sleep[order(sleep$group, sleep$ID), ]
Prueba t pareada
> t.test(extra ~ group, sleep, paired=TRUE)
Prueba de
Paired t-test
data: extra by group
t = -4.0621, df = 9, p-value = 0.002833
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-2.4598858 -0.7001142
S ample estimates:
mean of the differences
-1.58
Prueba de
Lo mismo para vectores separados
> t.test(dormi_bien$group1, dormi_bien$group2, paired=TRUE)
Paired t-test
data: dormi_bien$group1 and dormi_bien$group2
t = -4.0621, df = 9, p-value = 0.002833
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-2.4598858 -0.7001142
sample estimates:
mean of the differences
-1.58
“R: Contraste de Hipótesis”
M.Sc. Henry Luis López García
Maestría en Economía y Finanzas
@Hen1985 hlopez@unan.edu.ni
Bibliografía
1. Binek, R. (2015). Kosaciec szczecinkowaty Iris setosa [Image]. Retrieved from
https://commons.wikimedia.org/wiki/File:Kosaciec_szczecinkowaty_Iris_setosa.jp
g#/media/File:Kosaciec_szczecinkowaty_Iris_setosa.jpg
2. Chihara, L. M., & Hesterberg, T. C. (2018). Mathematical Statistics with
Resampling and R (2nd ed.). Wiley.
3. Kloke, J., & McKean, J. W. (2014). Nonparametric Statistical Methods Using R
(Chapman & Hall/CRC The R Series Book 25) (English Edition) (1.a ed.). Chapman
and Hall/CRC.
4. González, G. C., Liste, V. A., & Felpeto, B. A. (2011). Tratamiento de datos con R,
Statistica y SPSS (1.a ed.). Ediciones Diaz de Santos.
5. Rasch, D., Pilz, J., Verdooren, L. R., & Gebhardt, A. (2011). Optimal Experimental
Design with R (English Edition) (1.a ed.). Chapman and Hall/CRC.
6. Husson, F., Le, S., & Pagès, J. (2017). Exploratory Multivariate Analysis by Example
Using R (2nd ed.). CRC Press.

También podría gustarte