Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Taller Práctico en R

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

Año: 20222 Periodo: I PAO


Materia: Estadística

Practica en Prueba de Hipótesis e Intervalos de confianza


R:
Fecha: 11 julio 2022 Duración 120
: minutos

1. Prueba de hipótesis para la razón de varianzas e Intervalo de Confianza

Ejercicio 1: Un experimento publicado en The American Biology Teacher estudió la eficacia de


usar 95% de etanol y 20% de blanqueador como desinfectantes para eliminar contaminación
por bacterias y hongos cuando se cultivan tejidos de plantas. El experimento se repitió 15
veces con cada uno de los desinfectantes, usando berenjenas como el tejido de planta
cultivado. La información relevante se da en la siguiente tabla. ¿Estarías dispuesto a suponer
que las varianzas poblacionales subyacentes son iguales? Use 𝛼=0.01.

etanol95= 3.77, 3.85, 4.01, 3.62, 3.65, 3.66, 3.69, 4.06, 3.57, 3.70, 3.79, 3.58, 4.22, 4.21, 3.99.
blanqueador20= 4.80, 4.22, 5.05, 4.99, 4.67, 5.22, 4.74, 4.89, 4.69, 3.98, 5.60, 3.99, 4.01, 4.87,
5.75.

Planteamiento:
H 0 : σ 12=σ 22
2 2
H 1: σ 1 ≠ σ 2

Desarrollo usando R:

#Se asigna a la variable etanol95 y blanqueador20 los 15 datos de la muestra

etanol95<-c(3.77, 3.85, 4.01, 3.62, 3.65, 3.66, 3.69, 4.06, 3.57, 3.70, 3.79, 3.58, 4.22, 4.21,
3.99)
blanqueador20<-c(4.80, 4.22, 5.05, 4.99, 4.67, 5.22, 4.74, 4.89, 4.69, 3.98, 5.60, 3.99, 4.01,
4.87, 5.75)

#data= #Asigna los datosde los dos tipos de desinfectante al objeto data
(tabla de datos Dataframe)

data= data.frame(etanol95, blanqueador20)

#var.test {stats}= #Realiza una prueba F para comparar las varianzas de dos
muestras de poblaciones normales.

var.test(data$etanol95, data$blanqueador20, alternative = "two.side",conf.level = 0.99)


Si se quiere especificar una prueba unilateral, se debe especificar en
alternative= "greater" o  "less" y prueba bilateral alternative = "two.sided"

Resultado:

F test to compare two variances

data: data$etanol95 and data$blanqueador20


F = 0.16562, num df = 14, denom df = 14, p-value = 0.001818
alternative hypothesis: true ratio of variances is not equal to 1
99 percent confidence interval:
0.03852289 0.71205210
sample estimates:
ratio of variances
0.165621

Interpretación de resultados:

p-valor es < que 0.01, por lo tanto se rechaza H0 con un 99% de confianza, lo que indica
que ambas varianzas no son iguales.

Adicional, su intervalo de confianza (0.03852289 ; 0.71205210) no contiene al


uno, por lo que se corrobora la prueba, indicando que las varianzas no son iguales en la
eficacia de usar el etanol y el blanqueador como desinfectantes para tejidos de plantas.
2. Prueba de hipótesis para la diferencia de medias para dos muestras independientes, con
varianzas desconocidas e Intervalo de Confianza

Un psicólogo industrial desea estudiar los efectos de la motivación en las ventas de una empresa
en particular. De 24 vendedores nuevos que están en entrenamiento, a 12 se les va a pagar por
hora de trabajo y a otros 12 se les pagará por comisión. Los 24 individuos fueron asignados de
manera aleatoria a los dos grupos. Los datos siguientes representan el volumen de ventas (en
cientos de dólares) logrado durante el primer mes de trabajo.

Por hora 25.6 21.2 23.9 21.6 22.2 23.6 20.7 21.9 22.8 22.5 24.1 23.0
Comisión 22.4 26.1 25.4 22.8 27.3 23.4 28.5 22.5 23.7 23.2 27.7 24.5

a) ¿Existe evidencia de que los incentivos salariales (mediante comisiones) produce un


volumen de ventas promedio mayor? (utilice α=0.01).
b) ¿Qué suposiciones deben hacerse para efectuar la prueba anterior? Que venga ambas
muestras de una distribución normal, que sus muestras sean independientes y verificar la
igualdad de varianzas antes de realizar la prueba.
c) Encuentre el valor p e interprete su significado.

Planteamiento:
H 0 : µ1=µ2
H 1: µ 1 ≠ µ2

Desarrollo usando R:
xhora<-c(25.6,21.2,23.9,21.6,22.2,23.6,20.7,21.9,22.8,22.5,24.1,23.0)
xcomisión <-c(22.4,26.1,25.4,22.8,27.3, 23.4,28.5,22.5, 23.7,23.2,27.7,24.5)
datos=data.frame(xhora,xcomisión)

Primero verifico la igualdad de varianzas:


2 2
H 0 : σ 1 =σ 2
2 2
H 1: σ 1 ≠ σ 2
var.test(datos$xhora, datos$xcomisión, alternative = "two.side",conf.level = 0.99)

F test to compare two variances

data: datos$xhora and datos$xcomisión


F = 0.41095, num df = 11, denom df = 11, p-value = 0.1558
alternative hypothesis: true ratio of variances is not equal to 1
99 percent confidence interval:
0.07725145 2.18612783
sample estimates:
ratio of variances
0.410952

p-valor es > que 0.01, por lo tanto no se rechaza H0 con un 99% de confianza, lo que indica
que las medias son iguales, ambas varianzas son iguales.

Segundo, verifico la diferencia de medias, con varianzas iguales:

t.test(datos$xhora,datos$xcomisión, alternative = "two.side", var.equal=T, conf.level = 0.99)

Two Sample t-test

data: datos$xhora and datos$xcomisión


t = -2.7467, df = 22, p-value = 0.01177
alternative hypothesis: true difference in means is not equal to 0
99 percent confidence interval:
-4.12000816 0.05334149
sample estimates:
mean of x mean of y
22.75833 24.79167

Interpretación de resultados:

p-valor es > que 0.01, por lo tanto no se rechaza H0 con un 99% de confianza, lo que indica
que no hay diferencia significativa entre ambos incentivos salariales, x hora o comisión.

Adicional, su intervalo de confianza ( -4.12000816 ; 0.05334149) incluye el cero, por


lo que se corrobora la prueba, indicando que la media de ambos incentivos son iguales.
3. Prueba de hipótesis para la diferencia de medias para dos muestras pareadas e Intervalo de
Confianza

10 individuos participan en un programa de cambio de dieta para estimar la pérdida de peso


en libras, se pesa antes y después del programa. Construya un IC con un nivel de confianza del
98%. Y una prueba de hipótesis para confirmar si hay alguna diferencia significativa en el
programa.

Antes: 195, 213, 247, 201, 187, 210, 215, 246, 294, 310
Después: 187, 195, 221, 190, 175, 197, 199, 221, 278, 285

Desarrollo usando R:
data= data.frame(antes<-c(195,213,247,201,187,210,215,246,294,310),
despues<-c(187,195,221,190,175,197,199,221,278,285))

t.test(data$antes, data$despues, paired=TRUE, alternative = " "two.side", conf.level = 0.98)

Paired t-test

data: data$antes and data$despues


t = 8.3843, df = 9, p-value = 1.519e-05
alternative hypothesis: true difference in means is not equal to 0
98 percent confidence interval:
11.27929 22.72071
sample estimates:
mean of the differences
17

Interpretación de resultados:

p-valor es < que 0.02, por lo tanto, se rechaza H0 con un 98% de confianza, lo que indica
que hay diferencia significativa entre el antes y después del programa.
4. Prueba de hipótesis para la diferencia de proporciones e Intervalo de Confianza

Antecedente sobre la prueba:

Para realizar una prueba z de una proporción en R, podemos usar la siguiente función:

prop.test (x, n, p = 0.5, alternativa = «two.sided», correct = TRUE)

donde:

 x: el número de éxitos


 n: el número de ensayos
 p: La proporción de población hipotética
 alternativa: la hipótesis alternativa
 Correct- si se aplica o no la corrección de continuidad de Yates

Ejemplo:

Algunos investigadores deseaban conocer si la proporción de jóvenes  que consumían alcohol


había decrecido entre 2014 y 2019 Ellos analizaron los datos de dos estudios nacionales. En un
estudio realizado en el 2014, 4324 de una muestra de 5252 menores de 20 años respondieron
que ellos tomaban alcohol. En un estudio similar en el 2019, 3820 de una muestra de 4845
menores de 20 años indicaron que ellos tomaban alcohol.

¿Qué proporción de la muestra tomada en el 2014  bebía alcohol?, ¿Qué proporción de la


muestra tomada en el 2014  tomaba alcohol?

Plantee las hipótesis para probar la conjetura de los investigadores

Calcule el estadístico de prueba y concluya.

¿Existe disminución en el hábito de beber alcohol por parte de los jóvenes?

Planteamiento:
x 1=¿ 4324 jóvenes menores de 20 años que respondieron.
n1 =5252en total de la muestra 1

x 2=3820 jóvenes menores de 20 años que respondieron


n2 =4845 en total de la muestra 2

H 0 : P2=P 1
H 1 : P2 < P1
Desarrollo usando R:
prop.test (x = c(4324, 3820) , n=c(5252, 4845) , alternative = "less", conf.level = 0.95,
correct=FALSE)

2-sample test for equality of proportions without continuity


correction

data: c(4324, 3820) out of c(5252, 4845)


X-squared = 19.634, df = 1, p-value = 1
alternative hypothesis: less
95 percent confidence interval:
-1.00000000 0.04782848
sample estimates:
prop 1 prop 2
0.8233054 0.7884417

Interpretación de resultados:

p-valor es > que 0.05, por lo tanto, no se rechaza H0 con un 98% de confianza, lo que indica
que hay diferencia significativa entre ambas proporciones.

También podría gustarte