Trabajo Finale Stadi Stica
Trabajo Finale Stadi Stica
Trabajo Finale Stadi Stica
PLAN DE TRABAJO
DEL ESTUDIANTE
INFORMACIÓN GENERAL
Curso/ Mód..
Estadística aplicada a las TI.
Formativo
2. PREGUNTAS GUIA
Durante la investigación de estudio, debes obtener las respuestas a las siguientes interrogantes:
Nº PREGUNTAS
5
1. ¿Qué entiende por media, moda y mediana?
En estadísticaHOJA
la mediaDE RESPUESTAS
es también A aritmética
llamada la media LAS PREGUNTAS
de un conjunto de GUÍA
valores numéricos.
La mediana es el valor medio de un conjunto de datos cuando los valores se ordenan de forma
ascendente o descendente. La moda representa el valor o categoría más común dentro del conjunto
de datos.
La media, la mediana y la moda son las tres medidas de tendencia central más usadas para
poblaciones que no cuentan con demasiados datos, es decir, que no necesitan agruparse.
Al hablar de medidas de tendencia central, nos referimos a medidas estadísticas que pretenden
resumir en un único valor a un conjunto de valores.
La media, mediana y moda se expresan en la misma unidad que los datos originales. Estas medidas
proporcionan información sobre el valor central o típico de un conjunto de datos, ayudándonos a
analizar y comparar diferentes puntos de datos. (QuestionPro). Recuperado de
https://www.questionpro.com/blog/es/la-media-la-mediana-y-la-moda/. (Acceso el 4 de Julio del 2023).
La media es la medida de tendencia central más comúnmente utilizada y se calcula sumando todos
los valores en un conjunto de datos y dividiendo esta suma por la cantidad de valores en el conjunto
(Triola, M. F. 2018, p. 2).
La mediana es la medida de tendencia central que divide un conjunto de datos ordenados en dos
partes iguales, de manera que el 50% de los valores se encuentren por encima de la mediana y el otro
50% se encuentren por debajo (Triola, M. F. 2018, p. 50).
La moda es el valor o valores que aparecen con mayor frecuencia en un conjunto de datos o una
distribución, es decir, es el valor que ocurre con mayor probabilidad. (Triola, M. F. 2018, p. 36).
4.
5.
6.
HOJA DE PLANIFICACIÓN
PROCESO DE EJECUCIÓN
SEGURIDAD / MEDIO AMBIENTE /
NORMAS -ESTANDARES
OPERACIONES / PASOS /SUBPASOS
1. MÁQUINAS Y EQUIPOS
-Laptop Asus Vivobook, Intel i7 11°, 2.6 gHz 12 GB RAM y 512 SSD.
-Disco Local C.
-Smartphone LG LM-X120HM.
3. HERRAMIENTAS E INSTRUMENTOS
5. MATERIALES E INSUMOS
LISTA DE RECURSOS
PICD-208
Estadística Aplicada
a TI
Ingeniería de Ciencia de
Datos e Inteligencia Artificial
Semestre II
PLANTEAMIENTO DEL TRABAJO
~ ∑ xⅈ ⋅ fⅈ
x=
n
M 0=Li +
( fⅈ + f i−1
)
( f i−fⅈ−1 ) + ( fⅈ+ f i̇+1 )
⋅a
( )
n
−Fⅈ−1
2
Mⅇ =Li + ⋅a
fⅈ
Nº
Li Ls xi fi Fi hi Hi xi*fi (xi-~
x )**2
1
70 90 80 16 16 0.08 0.08 1280 10404
2
90 110 100 12 28 0.06 0.14 1200 6724
3
110 130 120 8 36 0.04 0.18 960 3844
4
130 150 140 14 50 0.07 0.25 1960 1764
5
150 170 160 20 70 0.1 0.35 3200 484
6
170 190 180 24 94 0.12 0.47 4320 4
7
190 210 200 32 126 0.16 0.63 6400 324
8
210 230 220 34 160 0.17 0.8 7480 1444
9
230 250 240 40 200 0.2 1 9600 3364
3. La cantidad media que se han gastado, la cantidad más frecuente y la cantidad que tenían como
máximo el 50% de los trabajadores que menos cobraban.
La cantidad que tenía como máximo el 50% de los trabajadores que menos cobraban era:
Para calcular este valor nos ubicaremos en los primeros intervalos de clase, esto hasta alcanzar el 50%
de los trabajadores que por orden de la tabla se ubicaran entre los que menos cobraban, usaremos los
intervalos que van desde el número de clase 1 hasta el número de clase 6, teniendo así 104
trabajadores en total, buscando el límite superior de ese intervalo de clase obtendremos que la
cantidad que tenía como máximo el 50% de trabajadores que menos cobraba era S/. 190.00.
R=LS−Li
Obtenemos como que el rango de distribución es: S/. 180 lo que nos indica que la dispersión entre
nuestros datos es alta.
IQR=Q 3−Q1
( )
kn
−fⅈ −1
4
Qk =Li + A
F i−F i−1
Cuando Qk = Q1, k=1; Qk=Q2, k=2 y Qk=Q3, k=3 y cuando k.n/4 = Fi, Qk = Ls del mismo número de
clase que el Fi.
Entonces operando:
Q1 = 150.
Q2 = 193,75.
Q3 = 224.
Finalmente, el IQR es: Q3 – Q1 = 224 – 150 = 74.
Dado que buscamos el mínimo del 20% de los empleados con la mayor cantidad de viáticos, nos
enfocaremos en los intervalos de clase más altos. En este caso, el 20% corresponde a los dos
intervalos más altos: el intervalo 8 (210 - 230) y el intervalo 9 (230 - 250).
El número de empleados en el intervalo 8 es 34. El número de empleados en el intervalo 9 es 40.
Por lo tanto, el grupo que representa el mínimo del 20% de los empleados con la mayor cantidad de
viáticos corresponde al 37% del total de la empresa.
6. El intervalo centrado en la cantidad media en que se encuentran el 75 % de los datos. ¿Es, pues,
el sueldo medio muy representativo del conjunto de los viáticos?
Para calcular el intervalo centrado en la media primero debemos determinar el tipo de distribución de
nuestros datos, para determinar el mejor método para hallar los intervalos. Además, hallaremos el
coeficiente de curtosis para determinar el grado de concentración que presentan los valores de la
variable alrededor de la zona central de la distribución de frecuencias.
4
∑ ( xⅈ −x ) ⋅fⅈ
K= −3
N ⋅σ 4
2967811200
K= −3=736.977
4010678.42
Mediana
Media
Según el gráfico podemos distinguir que el tipo de nuestra distribución es de sesgo negativo, podemos
determinar esto siguiendo la curva en el histograma y según la esquematización de la distribución de las
medidas de tendencia central.
En resumen, nuestra distribución es de sesgo negativo y leptocúrtica, esto implica que hay una
concentración de valores más altos hacia la derecha de la distribución y una mayor probabilidad de
valores extremos tanto en el lado derecho como en el lado izquierdo. Esto puede indicar que hay una
parte significativa de la distribución con valores más altos y una mayor dispersión alrededor de la media.
Si bien existen otros métodos para hallar los intervalos centrados en la media como el teorema de
Chebyshev o la distribución Gamma, pero usamos el método de rango intercuartílico por ser el método
que más se ajusta a nuestro planteamiento ya que nos otorgará mayor precisión en una distribución con
sesgo negativo y con coeficiente de curtosis mayor a cero.
El rango intercuartílico (IQR) es una medida de dispersión que se calcula como la diferencia entre el
tercer cuartil (Q3) y el primer cuartil (Q1). El IQR es utilizado como una medida robusta de variabilidad,
ya que no se ve afectado por valores atípicos o extremos en los datos.
Para encontrar el límite inferior del intervalo centrado en la media, podemos restar la mitad del IQR a la
media:
Para encontrar el límite superior del intervalo centrado en la media, podemos sumar la mitad del IQR a la
media:
Por lo tanto, el intervalo centrado en la media en el que se encuentran el 75% de los datos es de 145 a
219.
Entonces, respondiendo a la pregunta de si el sueldo medio es representativo del conjunto de los viáticos
podemos decir que dado que el sueldo medio de S/. 182 se encuentra dentro de este rango, indica que
es una estimación representativa del conjunto de los viáticos.
Además, la mediana de S/193 y la moda de S/. 232 también están cerca del sueldo medio, lo que
refuerza la idea de que el sueldo medio es representativo de los viáticos.
7. En el mes siguiente, la empresa decidió aumentar los viáticos de todos los trabajadores un 5 %.
Además, les dio una prima de 50 soles en concepto de productividad. Calcula el salario medio,
el salario más frecuente y el salario que tenían como máximo, el 50 % de los trabajadores que
menos cobran el mes siguiente.
Usando los datos anteriores como la media y moda descubriremos la nueva media y la nueva moda
afectando los valores anteriores en base a lo planteado:
5% x 232.6 = 11.63
La nueva cantidad co
mo máximo que tenían el 50 % de trabajadores que menos cobran el mes siguiente es:
5% x 190 = 9.5
8. De los viáticos de otra empresa, que pertenece al mismo sector, se sabe que la media aritmética
de sus trabajadores es de 120 soles, con una varianza de 2,5 soles. ¿Qué empresa tiene un
viatico medio más representativo? Razona la respuesta.
Vemos que la varianza de la primera empresa (141.78) es considerablemente mayor que la varianza de
la segunda empresa (2.5). Esto indica que la dispersión de los viáticos en la primera empresa es
mucho mayor que en la segunda empresa, lo que implica una mayor variabilidad en los datos alrededor
de la media.
Dado que la varianza de la segunda empresa es significativamente más baja, podemos concluir que la
media aritmética de 120 soles de la segunda empresa es más representativa y confiable en términos
de viáticos medios.