Estadistica Tarea8 JGranoble
Estadistica Tarea8 JGranoble
Estadistica Tarea8 JGranoble
Estadística Inferencial –
Pruebas de Hipótesis
Estadística
Actividades
Práctica: Ejercicios y problemas
Descripción de la actividad
Resolver los ejercicios mostrados a continuación, utilizando los conceptos teóricos revisados en
la unidad 3
Bibliografía: Información bibliográfica que fue requerida para la resolución de esta tarea
siguiendo las normas APA
Nombre del fichero: “primerApellido_primerNombre_siglasAsignatura_U#_T1”,
ejemplo: Lopez_Juan_CBCEESTAJUS_U3_T1 Formato de archivo a subir: PDF.
Rúbrica:
Criterios Nivel Bajo Nivel Medio Nivel Alto Sub-Puntajes
(0.25) (0.50) (0.75)
Orden y No se presenta la Es poco organizada La resolución
Presentación resolución del ejercicio en la presentación de del ejercicio se
forma organizada la resolución presenta de
ejercicio forma
organizada
Organización del No se presenta el código Es poco organizado El código es
código. ordenado y de forma el código y no organizado y es
secuencial siempre de forma secuencial.
secuencial
Compilación correcta La compilación no ocurre La compilación del La compilación
debido a errores código presenta del código no
significativos algunos errores presenta
errores
Terminología y La terminología y símbolos Se utilizan Se utiliza
símbolos usados corresponden a los terminología y terminología y
revisados en la sección símbolos que símbolos
dificultan la adecuados y
comprensión cuando se
introduce
simbología
nueva se
identifica
claramente su
significado
Totales
ESTADISTICA
UNIDAD 3: TAREA 1
Para resolver los ejercicios prácticos de esta tarea se recomienda crear un proyecto llamado
U3EST T1
1. Una persona se sometió a una prueba para detectar una pandemia generalizada. El
médico hizo un diagnostico clínico de que la persona no tiene esta enfermedad. Más tarde,
cuando se realizó un análisis de sangre, salió positivo. ¿Cuál de los siguientes errores ha
cometido el médico?
a) Error tipo 0
b) Error tipo 2
c) Error tipo 1
d) No se cometió´ error
2. Supongamos que está probando la eficacia de los programas de aprendizaje electrónico
para mejorar la puntuación de los estudiantes. La puntuación media de los estudiantes se
mide antes y después de la introducción de los programas de e-learning. Después de
comparar las medias mediante una prueba de hipótesis, se obtiene un valor de p de 0,02.
Esto significa que:
3
3. En el archivo ventasprepost.csv se encuentran almacenadas las ventas promedio diarias
de un mes de 100 negocios de dos sectores de la ciudad previo a la declaración de la
emergencia sanitaria y las ventas promedio diarias de un mes posterior a la declaración
del sema ‘foro amarillo. Contestar las siguientes preguntas:
- cols(
- NEGOCIO = col_character(),
- SECTOR = col_character(),
- VENTAS_PRECOVID = col_number(),
- VENTAS_POSTCOVID = col_number()
a) ¿El promedio de las ventas pre emergencia sanitaria es igual a 2000 dólares?
H0 = u es igual a 2000
H1 = u es diferente de 2000
desvest = sd(ventas$VENTAS_PRECOVID)
t.test(ventas$VENTAS_PRECOVID, mu = 2000, sigma.x = desvest, conf.level = 0.95)
El promedio de las ventas del SECTOR1 es igual o menor que el promedio de las ventas del SECTOR2.
c) ¿El promedio de las ventas post emergencia sanitaria es menor a 2000 dólares?
H0: u < = 2000
H1: u > 2000
desviacion = sd(ventas$VENTAS_POSTCOVID)
t.test(ventas$VENTAS_POSTCOVID, mu = 2000, sigma.x = desviacion, conf.level = 0.95)
d) ¿El promedio de las ventas del SECTOR1 es igual al promedio de las ventas del SECTOR2
posterior a la emergencia sanitaria?
H0: u1 es igual a u2
H1: u1 es diferente a u2
posterior<-select(ventas,SECTOR,VENTAS_POSTCOVID)
sec1<-filter(posterior, SECTOR %in% c("SECTOR1"))
sec2<-filter(posterior, SECTOR %in% c("SECTOR2"))
z.test(x=sec1$VENTAS_POSTCOVID,
sigma.x = sd(sec1$VENTAS_POSTCOVID),
y=sec2$VENTAS_POSTCOVID, sigma.y = sd(sec2$VENTAS_POSTCOVID),
alternative = "greater", conf.level = 0.95)
e) En general, ¿el promedio de las ventas pre emergencia sanitaria es mayor al promedio de
las ventas post emergencia sanitaria?
z.test(x=ventas$VENTAS_PRECOVID, sigma.x = sd(ventas$VENTAS_PRECOVID),
5
4. En el archivo PESOS.csv se encuentran almacenados los pesos promedios de un grupo de
hombres y mujeres previo y posterior a un tratamiento de reducción de peso que incluye
ejercicios, una guía de nutrición y un medicamento inhibidor del apetito.
pesos<- read_delim("PESOS (1).csv", ";",
escape_double = FALSE, trim_ws = TRUE)
-- Column specification --------------------------------------------------
cols(
SEXO = col_character(),
PREV_TRAT = col_number(),
POST_TRAT = col_number()
)
a) ¿El promedio de los pesos de las mujeres previo al tratamiento es igual a 70 kg.?
pesotratamiento<-select(pesos,SEXO,PREV_TRAT, POST_TRAT)
mujeres<-filter(pesotratamiento, SEXO %in% c("FEMENINO"))
Ho: U es igual 70
H1: U es diferente 70
c) ¿El promedio de los pesos de los hombres previo al tratamiento es menor a 80 kg.?
Ho: U < 80
H1: U => 80
devest=sd(hombres$PREV_TRAT)
z.test(hombres$PREV_TRAT, mu = 80, sigma.x = devest, conf.level = 0.95)
Los pesos de las mujeres posterior al tratamiento son menores que el de los hombres.
e) En general, ¿el promedio de loa pesos previo al tratamiento es mayor al promedio de los
pesos posterior al tratamiento?
H0: u1 => u2
H1: u1 < u2
El promedio de los pesos previo al tratamiento es menor que cuando se está en tratamiento.
5. Los ferrocarriles de montaña de cierta montaña en Alemania quieren ajustar su oferta a los deseos
y necesidades de sus huéspedes para mejorar el atractivo de la zona de esquí. Para ello, la
dirección realiza una breve encuesta representativa y pregunta a 150 invitados (n = 150) sobre
su satisfacción con la oferta actual. En la hoja de cálculo “legends” del archivo tourism.xlsx se
encuentra (en inglés) el detalle de cada variable, mientras que en el archivo tourism.csv están los
datos.
7
turismo <- read_delim("tourism.csv", ";",
escape_double = FALSE, trim_ws = TRUE) ## ##
Column specification --------------------------------------------------
cols(
guest = col_double(),
accommodation = col_double(),
stay = col_double(),
diversity = col_double(),
waitingtime = col_double(),
safety = col_double(),
quality = col_double(),
satisfaction = col_double(),
price = col_double(),
expenses = col_double(),
recommendation = col_double(),
skiholiday = col_double(),
sex = col_double(),
country = col_double(),
age = col_double(),
education = col_double()
)
La satisfacción sí ha aumentado.
b) El gerente de turismo quiere saber si las mujeres gastan más dinero al día que los hombres.
Pruebe este problema con un nivel de significancia del 10%
H0: U1 > U2
H1: U1 < = U2
gastos<-select(turismo,sex,expenses)
library(mlbench)
data(PimaIndiansDiabetes2)
data(PimaIndiansDiabetes2)
a) Pruebe si la diferencia de medias de las variables insulin y mass es mayor que cero con un
nivel de significancia de 0,05.
H0: U1,U2 es igual a 0
H1: U1,U2 es diferente a 0
t.test(PimaIndiansDiabetes2$insulin,PimaIndiansDiabetes2$mass,
alternative = "two.sided", var.equal = T, mu=0, conf.level = 0.95)
b) Realice una prueba de hipótesis para decidir que varianza, para las variables mass y tríceps,
es menor. Sugerencia: pruebe si el cociente entre las varianzas es menor que 1.
desvnvm=sd(data2$mass)
mediavm=mean(data2$mass)
CVt <- desvnvm / mediavm * 100
CVt
[1] 21.33558
var.test(data1$triceps,data2$mass,alternative="greater",mu=0,var.equal=TRUE,c onf.level=0.95)
9
7. Un gimnasio ofrece un programa de acondicionamiento físico y pérdida de peso, según los
administradores del gimnasio este programa dará´ como resultado una pérdida de peso mínima
de 3 kg después de 30 días. Para verificar esta afirmación se estudiaron 16 clientes que se
sumaron a este programa. Se compararon sus pesos antes y después de someterse a este
programa.
a) Con los datos mostrados en la tabla construya una data frase llamado programa Cuadro 1:
Pesos antes y después del programa
Cliente Antes Después
1 56,00 52,00
2 95,00 91,00
3 78,00 77,00
4 67,00 65,00
5 59,00 54,00
6 81,00 78,00
7 60,00 54,00
8 56,00 55,00
9 70,00 65,00
10 78,00 76,00
11 84,00 82,00
12 71,00 66,00
13 90,00 88,00
14 101,00 94,00
15 54,00 53,00
16 60,00 55,00
antes <-c(56.00,95.00,78.00,67.00,59.00,81.00,60.00,56.00,
••••••••••••70.00,78.00,84.00,71.00,90.00,101.00,54.00,60.00)
programa<-data.frame(clientes,antes,despues)
b) Realice la prueba adecuada para probar la hipótesis de que hay una pérdida de peso de por
lo menos 3 kg. (suponiendo que los pesos de la población se distribuyen normalmente).
t.test(programa$antes,programa$despues,alternative="greater",mu=3,var.equal=T RUE,conf.level=0.95)
8. En el cuadro 2 están los datos de los salarios anuales de 144 personas pertenecientes a dos grupos
de ocupación distintos. En el grupo 1 se encuentran trabajadores de medios de comunicación y
empresas de marketing, mientras que en el grupo 2 se encuentran trabajadores dedicados a
educación. Los datos además pueden ser encontrados en el archivo sueldos.xlsx. Se pide:
b) Pruebe la hipótesis que las medias poblacionales de los dos grupos son iguales. Previamente,
verifique la igualdad de las varianzas.
H0: u1 es igual a u2
H1: u1 es diferente a u2
11
Cuadro 2: Salarios Anuales de Dos grupos Ocupacionales
Grupo 1 Grupo 2