Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Practicas Junio2012

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

Grado en IIAA y Grado en IHJ

Asignatura: Estadística Aplicada. Curso 2011-2012


Examen de prácticas de JUNIO 2012

NOMBRE:...................................................APELLIDOS:......................................................................
ESPECIALIDAD:.....................................................................................................................................

Uno de los problemas más desafiantes para el control de contaminación del agua lo presenta la industria del curtido
de pieles. Los desechos de esta industria son químicamente complejos. Se caracterizan por valores elevados en la
demanda de oxígeno bioquímico, los sólidos volátiles y otras mediciones de contaminación. Los datos del fichero
curtido_pieles.txt, son los datos experimentales que se obtuvieron de 40 muestras de desperdicios que se tratan
químicamente. Para cada una de las 40 muestras se registraron las lecturas de la reducción del total de sólidos (,
en porcentajes) y de la reducción de demanda de oxígeno químico ( , en porcentaje). Después de importat los datos,
que se encuentran en la ruta habitual, se pide:

1. Realizar un histograma de ambos conjuntos de datos. Comentar las características más relevantes de ambos
gráficos.

2. Realizar (en el mismo gráfico) un diagrama de caja y bigotes para cada una de las características e identificar
cada una de las líneas que lo constituyen, así como los valores numéricos correspondientes.

3. ¿Existen datos atípicos? ¿Cuáles serían los valores admisibles entre los que se encontrarían los datos no atípicos
para cada uno de los dos conjuntos de datos?

4. A partir de los resultados obtenidos en los apartados anteriores, ¿qué medidas de centralización y dispersión
consideras más adecuadas para resumir cada uno de los conjuntos de datos? Dar el valor numérico de estos
descriptivos estadísticos.

5. Supongamos que la variable  =“Reducción de demanda de oxígeno químico” sigue un modelo normal de media
 = 321 y de desviación típica  = 1095, determinar la siguiente probabilidad:  (105 ≤  ≤ 405).

6. Proporcionar un intervalo de confianza al 96% para la media de la variable “Reducción de demanda de oxígeno
químico”. Indicar la distribución de probabilidad que ha utilizado para construir dicho intervalo.

7. ¿Podemos asumir que la media de la variable “Reducción de demanda de oxígeno químico” es inferior al 35.5%?
Indicar el procedimiento utilizado y dar la respuesta a partir del  −  obtenido.

8. Se quiere determinar un modelo para explicar la reducción de demanda de oxígeno químico a partir de la reduc-
ción del total de sólidos. ¿Qué modelo parece adecuado?

9. Realizar un ajuste por mínimos cuadrados con el fin de explicar la reducción de demanda de oxígeno químico
a partir de la reducción del total de sólidos. Indicar la ecuación del modelo propuesto y dar una medida de la
bondad del ajuste realizado.
10. Se detecta que una muestra presenta una reducción del total de sólidos igual al 33%, ¿podrías dar una estimación
para la reducción de demanda de oxígeno químico? ¿Es fiable esta estimación? Razonar la respuesta.
Grado en IIAA y Grado en IHJ:
SOLUCIÓN DEL EXAMEN DE PRÁCTICAS DE JUNIO 2012

1.‐
Variable X: Unimodal , existencia de datos atípicos y
cierta asimetría a la izda.

Variable Y: Unimodal , aparentemente simétrica y


parece no existir datos atípicos.
Previamente tenemos que apilar las variables:
2.‐
xmax.=64
ymax.=57 Notar que este dato
es la observación más
46 grande de la variable X
l f d
que no es clasificado
Q3=39.25 Q3=38.25 como atípico
Me=33 Me=34

Q1=24.75 Q1=25

ymin.=5
xmin.
min =3

Resúmenes numéricos de las características:


3.‐ Existe un dato atípico para la X.

El rango de valores para la X entre los que se encuentran las observaciones NO atípicas es:

Linf.=Q1‐1.5*RIQ=24.75‐1.5*(39.25‐24.75)=3
Lsup.= Q3+1.5*RIQ=39.25+1.5*(39.25‐24.75)=61
[3,61] Por eso, el dato x=64 es dato atípico.

Y para la característica Y sería:

Linf.=Q1‐1.5*RIQ=25‐1.5*(38.25‐25)=5.125
Lsup.= Q3+1.5*RIQ=38.25+1.5*(38.25‐25)=58.125
[5.125,58.125]

4.‐
Para la característica X tomaremos la Me=33 como medida de centro y el RIQ=14.5
RIQ=14 5
Como medida de dispersión ya que hemos visto que presenta un dato atípico.

Para la característica Y tomaremos la media =33 como medida de centro y la


desviación típica s=32.10 como medida de dispersión ya que hemos visto que la
distribución es aparentemente simétrica sin datos atípicos.
5.‐ Instrucciones:

Resultados:

De donde, la probabilidad que nos piden quedaría:


P (10.5  Y  40.5)  0.7785  0.0243  0.7542

6.‐ El intervalo de confianza al 96% para la media de Y quedaría como:

(28 4224 35 7776)


(28.4224,35.7776)

Y  Y
Trabajamos con la distribución T  tn
Y 1
SY / nY

que para nuestra muestra sería la t39


Para realizar este contraste
7.‐ El contraste que queremos realizar es: procedemos como sigue:
 H 0 : Y  35.5

 H1 : Y  35.5

Y obtenemos:

t0=‐1.9643 y el p‐valor=0.02835, de donde, hay mucha confianza


de q
que rechazar H0 es la decisión correcta.
La media poblacional de la variable Y es significativamente menor al 35.5%
8.‐ Empecemos realizando la nube de puntos :

Observamos que existe


Ob i t una
dependencia lineal de y en
función de x de tendencia positiva.

9.‐ Al ajustar la recta de mínimos cuadrados de y sobre x obtenemos que:

Recta ajustada:
Y=3.83313+0.8875*X

R2=0.949, lo que implica


un ajuste muy bueno.
10.‐ Para realizar la estimación de y cuando x=33% sólo hay que sustituir
en el modelo ajustado:

Y=3.83313+0.8875*33=33.1206%

Para estudiar su fiabilidad tenemos que comprobar si x=33% pertenece al rango


observado de las XX`s=(3
s (3,64),
64) lo que sí ocurre.
ocurre
Además el ajuste era muy bueno pues el R2 estaba muy próximo a 1

La estimación es fiable.

También podría gustarte