Rodriguez Palma TAREA6 U2T2
Rodriguez Palma TAREA6 U2T2
Rodriguez Palma TAREA6 U2T2
Desarrollo de la Actividad
ESTADÍSTICA
UNIDAD 2: TAREA 2
Para resolver los ejercicios de esta tarea se recomienda crear un proyecto llamado U2EST
T2.
1. Un entusiasta de las caminatas tiene una nueva aplicación para su teléfono inteligente que
resume sus caminatas usando un dispositivo GPS. Veamos la distancia recorrida (en km) y la
altitud máxima (en m) durante las ´ultimas 10 caminatas:
DISTANCIA 12.5 29,9 14.8 18,7 7,6 16,2 16,5 27,4 12,1 17,5
ALTITUD 342 1245 502 555 398 670 796 912 238 466
a) Calcule la media aritmética y la mediana tanto para la distancia como para la altitud.
De acuerdo con el problema la distribución de estos datos estaba ubicado en relativamente proporcional
con la otra variable, pero esto solo nos serviría para el primer ejercicio y de aquí en adelante estos datos
deben estar ordenados de forma ascendente para tener una mejor visión de los mismos, de igual manera
si no los ubicamos en el lugar exacto esto afectara el resultado
2. El conjunto rankingconstruccion.csv contiene los datos del año 2018 de las empresas que se
dedican al sector de la construcción. La revista Vistazo elabora cada año un ranking de las
empresas por cada sector de la producción al que pertenecen las empresas y un ranking general.
Investigue el uso de la función top n y con la ayuda de esta función seleccione las primeras 500
empresas de acuerdo con la utilidad, almacene estos resultados en el un conjunto llamado
rank500 construcción y de este conjunto de datos, realice los siguientes ejercicios:
d) Elabore una tabla de contingencia que relacione el tamaño de la empresa con la región
a la que pertenece la empresa.
a) Cargar cada conjunto de datos por separado, almacenando cada conjunto en una
variable que usted decida.
b) Unir los conjuntos de datos en un solo conjunto, para esto debe utilizar la función
rbind( ). Investigue el uso de esta función y utilícela para formar un ´único conjunto de
datos.
c) Con ayuda de la función top n( ) seleccione las primeras 500 empresas de acuerdo a la
utilidad. Guarde este ranking en un conjunto llamado ranking2018todos. Con el conjunto
ranking2018todos se pide:
1) Calcular las medidas de tendencia central y dispersión por sector de las utilidades.
5) ¿De qué ciudad son la mayoría de las empresas del ranking? Elabore una tabla de
frecuencia de las empresas por ciudad.
4. Los datos de entrega de pizzas (pizza delivery.csv) son un conjunto de datos simulados.
Los datos se refieren a un restaurante que ofrece pizza a domicilio. Contiene los pedidos
recibidos durante un periodo de un mes: mayo de 2014. Hay tres sucursales del
restaurante. La entrega de pizzas se gestiona de forma centralizada: un operador recibe
una llamada telefónica y reenviar el pedido a la sucursal más cercana a la dirección del
cliente. Uno de los cinco conductores (dos de los cuales solo trabajan a tiempo parcial los
fines de semana) entrega el pedido. El conjunto de datos captura la cantidad de pizzas
ordenadas, así como la factura final, que también puede incluir bebidas, ensaladas y
platos de pasta. El dueño del negocio observó un mayor número de quejas, principalmente
porque las pizzas llegan demasiado tarde y demasiado frías. Para mejorar la calidad del
servicio de su negocio, el propietario quiere medir (i) el tiempo desde la llamada hasta la
entrega y (ii) la temperatura de la pizza a la llegada (lo que se puede hacer con un
dispositivo especial). Idealmente, una pizza llega dentro de los 30 minutos posteriores a la
llamada; si tarda más de 40 minutos, se promete a los clientes una botella de vino gratis
(aunque no siempre se entrega). La temperatura de la pizza debe estar por encima de los
65◦ en el momento de la entrega. El análisis de los datos tiene como objetivo determinar
los factores que influyen en el tiempo de entrega y la temperatura de las pizzas.