Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Rodriguez Palma TAREA6 U2T2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

Datos del alumno Fecha

Nombres: Jean Pierre 03/08/23


Apellidos: Rodriguez Palma

Desarrollo de la Actividad
ESTADÍSTICA

UNIDAD 2: TAREA 2

Para resolver los ejercicios de esta tarea se recomienda crear un proyecto llamado U2EST
T2.

1. Un entusiasta de las caminatas tiene una nueva aplicación para su teléfono inteligente que
resume sus caminatas usando un dispositivo GPS. Veamos la distancia recorrida (en km) y la
altitud máxima (en m) durante las ´ultimas 10 caminatas:

DISTANCIA 12.5 29,9 14.8 18,7 7,6 16,2 16,5 27,4 12,1 17,5
ALTITUD 342 1245 502 555 398 670 796 912 238 466

a) Calcule la media aritmética y la mediana tanto para la distancia como para la altitud.

𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑖𝑎: 17.32


𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑑𝑒 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑖𝑎: 16.35
𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑎𝑙𝑡𝑖𝑡𝑢𝑑: 612.4
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑑𝑒 𝑎𝑙𝑡𝑖𝑡𝑢𝑑: 528.5

b) Determine el primer y tercer cuartiles para las variables de distancia y altitud.

c) Calcule el rango intercuartílico, la desviación media absoluta y la desviación estándar para


ambas variables. ¿Cuál es su conclusión sobre la variabilidad de los datos?

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑖𝑎: 4.844


𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑖𝑎: 6.44
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛𝑚𝑒𝑑𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑙𝑡𝑖𝑡𝑢𝑑: 234.68
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑎𝑙𝑡𝑖𝑡𝑢𝑑: 286,9049
Nombre de la Institución Educativa

d) Un metro corresponde a aproximadamente 3.28 pies. ¿Cuál es la altitud promedio cuando se


mide en pies en lugar de metros?

= 57,2 × 3.28 = 1860,41


e) Dibuje e interprete el diagrama de caja tanto para la distancia como para la altitud.
f) Analice la forma de la distribución dados los resultados de (a) y (b).

De acuerdo con el problema la distribución de estos datos estaba ubicado en relativamente proporcional
con la otra variable, pero esto solo nos serviría para el primer ejercicio y de aquí en adelante estos datos
deben estar ordenados de forma ascendente para tener una mejor visión de los mismos, de igual manera
si no los ubicamos en el lugar exacto esto afectara el resultado

2. El conjunto rankingconstruccion.csv contiene los datos del año 2018 de las empresas que se
dedican al sector de la construcción. La revista Vistazo elabora cada año un ranking de las
empresas por cada sector de la producción al que pertenecen las empresas y un ranking general.
Investigue el uso de la función top n y con la ayuda de esta función seleccione las primeras 500
empresas de acuerdo con la utilidad, almacene estos resultados en el un conjunto llamado
rank500 construcción y de este conjunto de datos, realice los siguientes ejercicios:

a) Elabore una tabla de frecuencia con las utilidades de las empresas.

Universidad Politécnica Salesiana


2
Nombre de la Institución Educativa

b) Elabore una tabla de frecuencia de las empresas de acuerdo con el sector.

c) Elabore una tabla de frecuencia con las ventas de las empresas.

Universidad Politécnica Salesiana


3
Nombre de la Institución Educativa

d) Elabore una tabla de contingencia que relacione el tamaño de la empresa con la región
a la que pertenece la empresa.

e) Construya un diagrama de barras de las empresas por tamaño

Universidad Politécnica Salesiana


4
Nombre de la Institución Educativa

f ) Construya un diagrama de barras de las empresas por tamaño de acuerdo con la


región.

g) Determine las medidas de tendencia central y de dispersión de las ventas de acuerdo a


la región, almacene los resultados en una tabla llamada ‘ventas construcción‘ y guarde
sus resultados en una hoja de cálculo.

Universidad Politécnica Salesiana


5
Nombre de la Institución Educativa

h) Determine los tres cuartiles de las utilidades de acuerdo al tipo de compañía,

i) Elabore el diagrama de caja de las utilidades

Universidad Politécnica Salesiana


6
Nombre de la Institución Educativa

j) Elabore el diagrama de caja de las utilidades de acuerdo al tipo de compañía.

Universidad Politécnica Salesiana


7
Nombre de la Institución Educativa

3. En el ejercicio anterior se elaboró el ranking de las empresas del sector construcción, la


revista Vistazo publica además un ranking de las mejores 500 empresas de todos los
sectores de acuerdo a su utilidad. Elabore el ranking de las 500 mejores empresas
utilizando los archivos de valores separados por comas (csv) rankingagricultura,
rankingcomercio, rankingconstruccion, rankinginmobiliaria y rankingmanufactura. El
flujo de trabajo recomendado para esta actividad es:

a) Cargar cada conjunto de datos por separado, almacenando cada conjunto en una
variable que usted decida.

b) Unir los conjuntos de datos en un solo conjunto, para esto debe utilizar la función
rbind( ). Investigue el uso de esta función y utilícela para formar un ´único conjunto de
datos.

Universidad Politécnica Salesiana


8
Nombre de la Institución Educativa

c) Con ayuda de la función top n( ) seleccione las primeras 500 empresas de acuerdo a la
utilidad. Guarde este ranking en un conjunto llamado ranking2018todos. Con el conjunto
ranking2018todos se pide:

1) Calcular las medidas de tendencia central y dispersión por sector de las utilidades.

Universidad Politécnica Salesiana


9
Nombre de la Institución Educativa

2) Determinar los deciles de las utilidades para todas las empresas.

3) Determinar los deciles de las utilidades por sector.

Universidad Politécnica Salesiana


10
Nombre de la Institución Educativa

4) Elaborar tablas de contingencia relacionando el sector y el tamaño de las em presas.

5) ¿De qué ciudad son la mayoría de las empresas del ranking? Elabore una tabla de
frecuencia de las empresas por ciudad.

Universidad Politécnica Salesiana


11
Nombre de la Institución Educativa

6) ¿a qué sector productivo pertenecen la mayoría de las empresas del ranking?

4. Los datos de entrega de pizzas (pizza delivery.csv) son un conjunto de datos simulados.
Los datos se refieren a un restaurante que ofrece pizza a domicilio. Contiene los pedidos
recibidos durante un periodo de un mes: mayo de 2014. Hay tres sucursales del
restaurante. La entrega de pizzas se gestiona de forma centralizada: un operador recibe
una llamada telefónica y reenviar el pedido a la sucursal más cercana a la dirección del
cliente. Uno de los cinco conductores (dos de los cuales solo trabajan a tiempo parcial los
fines de semana) entrega el pedido. El conjunto de datos captura la cantidad de pizzas
ordenadas, así como la factura final, que también puede incluir bebidas, ensaladas y
platos de pasta. El dueño del negocio observó un mayor número de quejas, principalmente
porque las pizzas llegan demasiado tarde y demasiado frías. Para mejorar la calidad del
servicio de su negocio, el propietario quiere medir (i) el tiempo desde la llamada hasta la
entrega y (ii) la temperatura de la pizza a la llegada (lo que se puede hacer con un
dispositivo especial). Idealmente, una pizza llega dentro de los 30 minutos posteriores a la
llamada; si tarda más de 40 minutos, se promete a los clientes una botella de vino gratis
(aunque no siempre se entrega). La temperatura de la pizza debe estar por encima de los
65◦ en el momento de la entrega. El análisis de los datos tiene como objetivo determinar
los factores que influyen en el tiempo de entrega y la temperatura de las pizzas.

Universidad Politécnica Salesiana


12
Nombre de la Institución Educativa

a) Calcule la media, la mediana, el mínimo, el máximo, el primer cuartil y el tercer


cuartil para todas las variables cuantitativas.

Universidad Politécnica Salesiana


13
Nombre de la Institución Educativa

b) Determine e interprete el percentil 99 para el tiempo de entrega y la temperatura.

Universidad Politécnica Salesiana


14
Nombre de la Institución Educativa

c) Grafique un diagrama de caja para el tiempo de entrega y la temperatura.

d) Construya una tabla de frecuencias para el tiempo de entrega.

Universidad Politécnica Salesiana


15
Nombre de la Institución Educativa

e) Construya una tabla de frecuencias para la temperatura

Universidad Politécnica Salesiana


16

También podría gustarte