Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Estdis U3 T8

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

1. Una persona se sometió a una prueba para detectar una pandemia generalizada. El medico hizo
un diagnóstico clínico de que la persona no tiene esta enfermedad. Mas tarde, cuando se realizó un
análisis de sangre, salió positivo. ¿Cuál de los siguientes errores ha cometido el medico?

a) Error tipo 0

b) Error tipo 2

c) Error tipo 1

d) No se cometió error

2. Supongamos que está probando la eficacia de los programas de aprendizaje electrónico para
mejorar la puntuación de los estudiantes. La puntuación media de los estudiantes se mide antes y
después de la introducción de los programas de e-learning. Después de comparar las medias
mediante una prueba de hipótesis, se obtiene un valor de p de 0, 02. Esto significa que:

a) La probabilidad de la hipótesis nula es 2 %

3. En el archivo ventasprepost.csv se encuentran almacenadas las ventas promedio diarias de un


mes de 100 negocios de dos sectores de la ciudad previo a la declaración de la emergencia sanitaria
y las ventas promedio diarias de un mes posterior a la declaración del semáforo amarillo. Contestar
las siguientes preguntas:

ad previo a la declaración de la emergencia sanitaria y las ventas promedio diarias de un mes


posterior a la declaración del semáforo amarillo. Contestar las siguientes preguntas:

a) ¿El promedio de las ventas preemergencia sanitaria es igual a 2000 dólares?

b) ¿El promedio de las ventas del SECTOR1 es mayor al promedio de las ventas del SECTOR2
previo a la emergencia sanitaria?
Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

c) ¿El promedio de las ventas post emergencia sanitaria es menor a 2000 dólares?

d) ¿El promedio de las ventas del SECTOR1 es igual al promedio de las ventas del SECTOR2
posterior a la emergencia sanitaria?

e) En general, ¿el promedio de las ventas pre emergencia sanitaria es mayor al promedio de
las ventas post emergencia sanitaria?
Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

4. En el archivo PESOS.csv se encuentran almacenados los pesos promedios de un grupo de hombres


y mujeres previo y posterior a un tratamiento de reducción de peso que incluye ejercicios, una guía
de nutrición y un medicamento inhibidor del apetito.

a) ¿El promedio de los pesos de las mujeres previo al tratamiento es igual a 70 kg.?

b) ¿El promedio de los pesos de las mujeres previo al tratamiento es igual al promedio de los
pesosde los hombres previo al tratamiento?

c) ¿El promedio de los pesos de los hombres previo al tratamiento es menor a 80 kg.?

d) ¿El promedio de los pesos de las mujeres posterior al tratamiento es menor al promedio de los
pesos de los hombres posterior al tratamiento?
Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

e) En general, ¿el promedio de loa pesos previo al tratamiento es mayor al promedio de los pesos
posterior al tratamiento?

5. Los ferrocarriles de montaña de cierta montaña en Alemania quieren ajustar su oferta a los deseos
y necesidades de sus huéspedes para mejorar el atractivo de la zona de esquí. Para ello, la dirección
realiza una breve encuesta representativa y pregunta a 150 invitados (n = 150) sobre su satisfacción
con la oferta actual. En la hoja de cálculo “legends”del archivo tourism.xlsx se encuentra (en inglés)
el detalle de cada variable, mientras que en el archivo tourism.csv están los datos.

a) El gerente de turismo del destino intenta averiguar si la satisfacción de los huéspedes ha


aumentado en los últimos años. Sabe qué hace unos años se realizó la misma encuesta y la
satisfacción general fue de solo 60 puntos. Pruebe al nivel de significancia del 5 % si la satisfacción
con la estación de esquí ha aumentado.

b) El gerente de turismo quiere saber si las mujeres gastan más dinero al día que los hombres.
Pruebe este problema con un nivel de significancia del 10 %
Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

6. El conjunto PimaIndianaDiabetes2 es un conjunto de datos de 9 medidas fisiológicas, como


glucosa, índice de masa y presión arterial de 768 mujeres de la tribu Pima ubicada en el sur de
Arizona. Los datos se encuentran en el paquete mlbench, para cargarlos puede utilizar el código:

library(mlbench)

data(PimaIndiansDiabetes2)

a) Pruebe si la diferencia de medias de las variables insulin y mass es mayor que cero con un
nivel de significancia de 0,05.

b) Realice una prueba de hipótesis para decidir qué varianza, para las variables mass y tríceps,
es menor. Sugerencia: pruebe si el cociente entre las varianzas es menor que 1.
Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

7. Un gimnasio ofrece un programa de acondicionamiento físico y pérdida de peso, según los


administradores del gimnasio este programa dará como resultado una pérdida de peso mínima de
3 kg después de 30 días. Para verificar esta afirmación se estudiaron 16 clientes que se sumaron a
este programa. Se compararon sus pesos antes y después de someterse a este programa.

b) Realice la prueba adecuada para probar la hipótesis de que hay una pérdida de peso de por lo
menos 3 kg. (suponiendo que los pesos de la población se distribuyen normalmente).

8. En el cuadro 2 están los datos de los salarios anuales de 144 personas pertenecientes a dos grupos
de ocupación distintos. En el grupo 1 se encuentran trabajadores de medios de comunicación y
empresas de marketing, mientras que en el grupo 2 se encuentran trabajadores dedicados a
educación. Los datos además pueden ser encontrados en el archivo sueldos.xlsx. Se pide:

a) Generar un conjunto de datos apropiado y leerlo en Rstudio.

b) Pruebe la hipótesis que las medias poblacionales de los dos grupos son iguales. Previamente,
verifique la igualdad de las varianzas.

Código general utilizado para todo el proyecto

library(readxl)

# EJER 3 ------

v<-read.csv(file = "ventasprepost.csv",header = T,sep = ";",dec = ",")

#View(v)

#### 3A ####

mean(v$VENTAS_PRECOVID)==2000

t.test(v$VENTAS_PRECOVID, alternative = "two.sided",


Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

mu = 2000, conf.level = 0.95)$p.value

#### 3B ####

s1<-v$SECTOR=="SECTOR1"

mean(v$VENTAS_PRECOVID[s1])>mean(v$VENTAS_PRECOVID[!s1])

var.test(v$VENTAS_PRECOVID[s1], v$VENTAS_PRECOVID[!s1],

ratio = 1,alternative = "two.sided",

conf.level = 0.95)$p.value

t.test(v$VENTAS_PRECOVID[s1],v$VENTAS_PRECOVID[!s1],

alternative = "greater",mu = 0,

conf.level = 0.95)$p.value

#### 3C ####

mean(v$VENTAS_POSTCOVID)<2000

t.test(v$VENTAS_POSTCOVID, alternative = "less",

mu = 2000, conf.level = 0.95)$p.value

#### 3D ####

mean(v$VENTAS_POSTCOVID[s1])==mean(v$VENTAS_POSTCOVID[!s1])

var.test(v$VENTAS_POSTCOVID[s1], v$VENTAS_POSTCOVID[!s1],

ratio = 1,alternative = "two.sided",

conf.level = 0.95)$p.value

t.test(v$VENTAS_POSTCOVID[s1],v$VENTAS_POSTCOVID[!s1],

alternative = "two.sided",mu = 0,var.equal = T,

conf.level = 0.95)$p.value

#### 3E ####

mean(v$VENTAS_PRECOVID)>mean(v$VENTAS_POSTCOVID)

var.test(v$VENTAS_PRECOVID, v$VENTAS_POSTCOVID,

ratio = 1,alternative = "two.sided",


Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

conf.level = 0.95)$p.value

t.test(v$VENTAS_PRECOVID,v$VENTAS_POSTCOVID,

alternative = "greater",mu = 0,

conf.level = 0.95)$p.value

#EJER 4 ----

p<-read.csv(file = "PESOS.csv",header = T,

sep = ";",dec = ",")

#View(p)

#### 4A #####

f<-p$SEXO=="FEMENINO"

mean(p$PREV_TRAT[f])==70

t.test(x = p$PREV_TRAT[f],alternative = "two.sided",

mu = 70,conf.level = 0.95)$p.value

#### 4B #####

x<-p$PREV_TRAT[f]

y<-p$PREV_TRAT[!f]

mean(x)==mean(y)

var.test(x = x,y = y,ratio = 1,alternative = "two.sided",

conf.level = 0.95)$p.value

t.test(x = x,y = y,alternative = "two.sided",mu = 0,

var.equal = T,conf.level = 0.95)$p.value

#### 4C #####
mean(p$PREV_TRAT[!f])<80

t.test(x=y,alternative = "less",mu = 80)$p.value

#### 4D #####

x<-p$POST_TRAT[f]

y<-p$POST_TRAT[!f]
Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

mean(x)<mean(y)

var.test(x = x,y = y,ratio = 1,alternative = "two.sided",

conf.level = 0.95)$p.value

t.test(x = x,y = y,alternative = "less",mu = 0,

var.equal = T,conf.level = 0.95)$p.value

#### 4E #####

x<-p$PREV_TRAT

y<-p$POST_TRAT

mean(x)>mean(y)
var.test(x = x,y = y,ratio = 1,alternative = "two.sided",

conf.level = 0.95)$p.value

t.test(x = x,y = y,alternative = "greater",mu = 0,

var.equal = F,conf.level = 0.95)$p.value

#EJER 5-----

d<-read.csv(file = "tourism.csv",sep = ";")

#View(d)

#### 5A ####

mean(d$satisfaction)>60

t.test(x = d$satisfaction,

alternative = "greater",mu = 60)$p.value

#### 5B ####

f<-d$sex==1
x<-d$expenses[f]

y<-d$expenses[!f]

mean(x)>mean(y)

var.test(x = x,y = y, ratio = 1,


Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

alternative = "two.sided",

conf.level = 95/100)$p.value

t.test(x = x,y = y,alternative = "greater",mu = 0,

var.equal = T,conf.level = 0.90)$p.value

# EJER 6 ----

library(mlbench)

data(PimaIndiansDiabetes2)

df<-PimaIndiansDiabetes2

#### 6A #### View(df)

x<-df$insulin

y<-df$mass

length(x)/length(y)

mean(x,na.rm = T)-mean(y,na.rm = T)>0

var.test(x = x,y = y,ratio = 1,

alternative = "two.sided")$p.value

t.test(x = x,y = y,alternative = "greater",mu = 0)$p.value

#### 6B ####

x<-df$mass

y<-df$triceps

var(x,na.rm = T)<var(y,na.rm = T)

var.test(x = x,y = y,ratio = 1,

alternative = "less")$p.value

# EJER 7 -----

#### 7A ####

ej<-read_xlsx(path = "tourism.xlsx",sheet = "ej7")


Datos del alumno Fecha

Nombres: Carlos Javier


02/02/2023
Apellidos: Cruz Montalvo

names(ej)<-c("Cliente","Antes","Despues")

#View(ej)

#### 7B ####

x<-ej$Antes

y<-ej$Despues

mean(x)-mean(y)>3

var.test(x = x,y = y,ratio = 1,

alternative = "two.sided")$p.value

t.test(x = x,y = y,alternative = "greater",mu = 3,

var.equal = T)$p.value

# EJER 8 ------

#### 8A ####

X<-read_xlsx(path = "sueldos.xlsx",sheet = "wage")

#View(X)

#### 8B ####

x<-X$Grupo1

y<-X$Grupo2

mean(x)==mean(y)

var.test(x = x,y = y,ratio = 1,

alternative = "two.sided")$p.value

t.test(x = x,y = y,alternative = "two.sided",

mu = 0,var.equal = T)$p.value

También podría gustarte