Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Trabajo Finale Stadi Stica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

SERVICIO NACIONAL DE ADIESTRAMIENTO EN TRABAJO INDUSTRIAL

PLAN DE TRABAJO
DEL ESTUDIANTE
INFORMACIÓN GENERAL

Apellidos y Nombres: López Chavarría, Pedro Yordi ID: 001476129

Dirección Zonal/CFP: Lima – Callao/Independencia.

Carrera: Ingeniería de ciencia de datos e inteligencia artificial. Semestre: II

Curso/ Mód..
Estadística aplicada a las TI.
Formativo

Tema del Trabajo: Trabajo Final del Curso.

1. PLANIFICACIÓN DEL TRABAJO

N ACTIVIDADES/ CRONOGRAMA/ FECHA DE ENTREGA


° ENTREGABLES
15/05 18/05 25/05 28/05 30/05 31/05 01/06 02/06 05/06 04/07 07/07
Completar información
X X
general
Planificación de
X X
trabajo.
Resolución de
X
preguntas guía
Llenado de lista de
X
recursos
Llenado de lista de
X
operaciones
Realizar diagrama o
X
dibujo.
Resolver el trabajo
X X X X
planteado
Entrega del trabajo
X
planteado

2. PREGUNTAS GUIA

Durante la investigación de estudio, debes obtener las respuestas a las siguientes interrogantes:

Nº PREGUNTAS

1 ¿Qué entiende por media, moda y mediana?

2 ¿Cómo se elabora una tabla de frecuencias?

3 ¿Cómo se calcula el rango de una distribución?

5
1. ¿Qué entiende por media, moda y mediana?
En estadísticaHOJA
la mediaDE RESPUESTAS
es también A aritmética
llamada la media LAS PREGUNTAS
de un conjunto de GUÍA
valores numéricos.
La mediana es el valor medio de un conjunto de datos cuando los valores se ordenan de forma
ascendente o descendente. La moda representa el valor o categoría más común dentro del conjunto
de datos.

La media, la mediana y la moda son las tres medidas de tendencia central más usadas para
poblaciones que no cuentan con demasiados datos, es decir, que no necesitan agruparse.
Al hablar de medidas de tendencia central, nos referimos a medidas estadísticas que pretenden
resumir en un único valor a un conjunto de valores.

La media, mediana y moda se expresan en la misma unidad que los datos originales. Estas medidas
proporcionan información sobre el valor central o típico de un conjunto de datos, ayudándonos a
analizar y comparar diferentes puntos de datos. (QuestionPro). Recuperado de
https://www.questionpro.com/blog/es/la-media-la-mediana-y-la-moda/. (Acceso el 4 de Julio del 2023).

La media es la medida de tendencia central más comúnmente utilizada y se calcula sumando todos
los valores en un conjunto de datos y dividiendo esta suma por la cantidad de valores en el conjunto
(Triola, M. F. 2018, p. 2).

Algunas características de la media son:

 Considera todas las puntuaciones.


 El numerador de la fórmula es la cantidad de valores.
 Cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra.

La mediana es la medida de tendencia central que divide un conjunto de datos ordenados en dos
partes iguales, de manera que el 50% de los valores se encuentren por encima de la mediana y el otro
50% se encuentren por debajo (Triola, M. F. 2018, p. 50).

Algunas características de la mediana son:

 En su cálculo no se incluyen todos los valores de la variable.


 La Mediana no es afectada por valores extremos.
 Puede ser calculada en distribuciones de frecuencia con clases abiertas. (Yoryi Alexander
Marte). Recuperado de http://www.geocities.ws/ymarte/trab/estcarmed.html. (Acceso el 4 de
Julio de 2023).

La moda es el valor o valores que aparecen con mayor frecuencia en un conjunto de datos o una
distribución, es decir, es el valor que ocurre con mayor probabilidad. (Triola, M. F. 2018, p. 36).

Algunas características de la moda son:

 Se puede hallar la moda para


variables cualitativas y cuantitativas. (Monografías). Recuperado de
https://www.monografias.com/trabajos81/caracteristicas-moda/caracteristicas-moda. (Acceso
el 4 de Julio de 2023).
 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
 Si en un grupo de datos hay dos o varias puntuaciones con la misma frecuencia y esa
frecuencia es la máxima, entonces la distribución es bimodal (en caso de que sean 2 valores)
o multimodal (en caso de que existan más de 2), es decir, tiene varias modas. (superprof).
Recuperado de
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/moda-
estadistica.html. (Acceso el 4 de Julio de 2023).

2. ¿Cómo se elabora una tabla de frecuencias?


Por lo general una tabla de frecuencias con datos agrupados se realiza cuando la cantidad
de datos es grande y/o la variable es continua, Básicamente consiste en agrupar los datos en
intervalos de una misma amplitud, denominados clases. (chapaesaflor). Recuperado de
https://chapaesaflor.pe/infoblog/tablas/para-que-sirve-una-tabla-de-distribucion-de-
frecuencias.html. (Acceso el 4 de Julio de 2023).

Para elaborar una tabla de frecuencias debemos:


 Hallar el número total de elementos en el estudio (N).
 Establecer el número de clases, que es la cantidad de intervalos en el que
distribuiremos los datos, se halla mediante la siguiente fórmula K = 1+3.33log(N).
 Establece las categorías (Xi). Recuerda que las categorías no se deben superponer,
es decir, ningún dato debe pertenecer a dos categorías, y ningún dato debe quedar
sin categoría, esto se hace usando la fórmula Ls + Li/2 = Xi.
 Halla las frecuencias absolutas (fi).
 Halla las frecuencias absolutas acumuladas (Fi).
 Halla las frecuencias relativas (hi).
 Halla las frecuencias relativas acumuladas (Hi). (matemóvil). Recuperado de
https://matemovil.com/como-construir-una-tabla-de-distribucion-de-frecuencias/.
(Acceso el 4 de Julio de 2023).

3. ¿Cómo se calcula el rango de una distribución?


El rango en una distribución se calcula como la diferencia entre el valor máximo y el valor
mínimo de los datos en el conjunto.
La fórmula para calcular el rango es:
Rango = Valor máximo - Valor mínimo
Donde:
 Valor máximo: Es el valor más grande o el máximo encontrado en el conjunto de
datos.
 Valor mínimo: Es el valor más pequeño o el mínimo encontrado en el conjunto de
datos.
El rango es una medida de dispersión simple que proporciona información sobre el alcance
total de los datos en la distribución. Sin embargo, es importante tener en cuenta que el rango
no considera la distribución completa de los datos y puede verse influenciado por valores
extremos o atípicos. (Triola, M. F. 2018, p. 36).
.

4.

5.

6.

HOJA DE PLANIFICACIÓN
PROCESO DE EJECUCIÓN
SEGURIDAD / MEDIO AMBIENTE /
NORMAS -ESTANDARES
OPERACIONES / PASOS /SUBPASOS

Buscar un lugar ventilado, aislado de ruidos y con buena  Acondicionar el o los


iluminación. espacios de trabajo, priorizar
el silencio, la buena
Colocar las herramientas a utilizar al alcance de la mano. iluminación y la ergonomía.
 Usar los equipos
Encender la laptop.
electrónicos con las
Conectar la laptop a la red local si no se conecta medidas de precaución
automáticamente. adecuadas, en caso de
manipulación de laptop
Ingresar al navegador Mozilla Firefox. tener las manos secas y el
Ingresar al campus virtual de SENATI en Blackboard. lugar de colocación seco,
de preferencia de un
Buscar en el menú de cursos el módulo de Estadística material que no conduzca
Aplicada a TI. mucho el calor como la
madera para evitar
Buscar en el menú del módulo de Estadística Aplicada a
sobrecalentar el
TI Actividades Entregables.
microprocesador.
Ubicar el acceso al Trabajo Final del curso.  Tener en la medida de lo
posible un asiento
Descargar archivo y guardarlo en Disco D bajo el nombre ergonómico o
de archivo “TrabajoFinalEstadistica.txt”. acondicionar una silla no
Abrir el archivo y proceder a leer atentamente las ergonómica en base a
indicaciones y requerimientos de la tarea. necesidades y
requerimientos propios de
Investigar y leer sobre conceptos desconocidos en libros o nuestro cuerpo.
por consultas en páginas web.  Proteger la vista mediante
lentes antireflex y con
Apuntar dichos conceptos, guardar los enlaces y tener al
medida de ser necesario.
alcance dichos conceptos.
 Tomar pausas activas de
Resolver los requerimientos relacionados al Plan de por lo menos 10 minutos
Trabajo del Estudiante: por cada jornada de 30
minutos.
 Completar el formulario de datos del alumno.  Caminar, salir y
 Leer y organizar la planificación del trabajo. despejarse, asi las ideas
 Leer y comprender las preguntas guía. también fluyen mejor.
 Completar las preguntas guía, de acuerdo al  Evitar usar demasiado
formato planteado por el docente, respetando papel o enchufar la laptop
normativa APA. y aparatos a la toma de
 Elaborar la hoja de planificación. corriente cuando no se
 Realizar el dibujo/esquema/diagrama, aunque sea necesite.
un bosquejo de lo que será al final de la entrega.  Finalmente adoptar
medidas en el camino
Proceder al desarrollo del problema planteado:
para situaciones
 Leer los objetivos del trabajo. imprevistas bajo una
 Leer el planteamiento del problema. cultura de prevención y
 En base a los conocimientos adquiridos durante planificación.
las sesiones educativas desarrollar las preguntas
consultando y verificando su certeza con fuentes
en libros y páginas web.
 Leer los apuntes sobre conceptos desconocidos,
leer sobre teoría relacionada a cuartil, percentil,
rango intercuartilico, intervalos centrados en la
media, distribución asimétrica, sesgada,
coeficiente de curtosis, ver ejemplos similares,
analizar la metodología y desarrollar los problemas
en base a la investigación.
 Verificar los resultados, guardar el archivo en
Disco D bajo el nombre de
“TrabajoFinalEstadistica.txt”.
 Cerrar programa Word 2016.

Buscar en el navegador el campus virtual de SENATI, en


Blackboard ubicar nuevamente el menú de Estadística
Aplicada a TI, ubicar la entrega del trabajo final y en la
casilla subir el archivo guardado en mi equipo.

Enviar archivo dentro de la fecha límite.

Cerrar los programas usados

Apagar la laptop correctamente.


DIBUJO O DIAGRAMA

TRABAJO FINAL DEL CURSO

LÓPEZ CHAVARRÍA, PEDRO YORDI

DIBUJO / ESQUEMA/ DIAGRAMA

1. MÁQUINAS Y EQUIPOS

-Laptop Asus Vivobook, Intel i7 11°, 2.6 gHz 12 GB RAM y 512 SSD.

-Mouse inalámbrico Logitech.


-Calculadora Casio fx950.

-Disco Local C.

-Router Huawei, terminal GPON.

-Smartphone LG LM-X120HM.

3. HERRAMIENTAS E INSTRUMENTOS

-Calculadora Casio fx950.

-Software de hoja de cálculo y gráficos estadísticos Microsoft Excel 2016.

-Regla de plástico de 30 cm. Marca Artesco.

-Software de edición de texto Microsoft Word 2016.

-Software de acceso al trabajo final y campus virtual Navegador Mozilla Firefox.

-Software de navegación por páginas web Mozilla Firefox.

5. MATERIALES E INSUMOS

-Libro “Consultor Matemáticas”, editorial Lexus.

-Cuaderno anillado A4 marca Andrea BOOK.

-Lapicero azul marca Faber Castell.

-Lápiz marca Stabilo, goma de borrar marca Artesco.

-Cargador de Smartphone y cargador de laptop.

-Material de limpieza para ambiente de trabajo marca Limpiatodo Sapolio y trapo


de limpieza casero. Material de limpieza para equipos electrónicos, paño de
microfibra y líquido de limpieza marca Teraware.

LISTA DE RECURSOS

INSTRUCCIONES: completa la lista de recursos necesarios para la ejecución del trabajo


.

Trabajo Final del Curso


TEMA: Integración de conceptos de estadística aplicada

PICD-208

Estadística Aplicada
a TI

Ingeniería de Ciencia de
Datos e Inteligencia Artificial

Semestre II
PLANTEAMIENTO DEL TRABAJO

Ejercicio: En el siguiente histograma se representa la distribución del dinero que durante el


último mes se han gastado en los trabajadores de una empresa por concepto de viáticos:
Se solicita:

1) Determinar la media, moda y mediana sabiendo que hay 200 trabajadores


2) La tabla de frecuencias que muestra los datos que tenemos.
3) La cantidad media que se han gastado, la más frecuente y la cantidad que tenían como máximo,
el 50 % de los trabajadores que menos cobraban.
4) Calcula e interpreta el rango de la distribución, así como el rango intercuartílico.
5) Calcula el mínimo del 20 % de los empleados con mayor cantidad de viáticos.
¿Qué porcentaje del total de la empresa corresponde a este grupo?
6) El intervalo centrado en la cantidad media en que se encuentran el 75 % de los datos. ¿Es,
pues, el sueldo medio muy representativo del conjunto de los viáticos?
7) En el mes siguiente, la empresa decidió aumentar los viáticos de todos los trabajadores un 5 %.
Además, les dio una prima de 50 soles en concepto de productividad. Calcula el salario medio,
el salario más frecuente y el salario que tenían como máximo, el 50 % de los trabajadores que
menos cobran el mes siguiente.
8) De los viáticos de otra empresa, que pertenece al mismo sector, se sabe que la media aritmética
de sus trabajadores es de 120 soles, con una varianza de 2,5 soles. ¿Qué empresa tiene un
viatico medio más representativo? Razona la respuesta.

OBJETIVO DEL TRABAJO


Este trabajo tiene como finalidad integrar conceptos desarrollados en el curso, a través de un
ejercicio aplicativo, el cual tiene como finalidad que el alumno este en la capacidad de:
✓ Saber clasificar las variables estadísticas.
✓ Saber analizar y realizar tablas de frecuencias de un conjunto de datos.
✓ Saber interpretar y construir los principales gráficos estadísticos.
✓ Conocer los conceptos y saber realizar los cálculos de las medidas de tendencia central y de
dispersión. Concretar con la aplicación del coeficiente de variación de Pearson en aquellas
situaciones que lo requieran.
1. Determinar la media, moda y mediana sabiendo que hay 200 trabajadores.

-Para determinar la media en datos agrupados usaremos la siguiente formula.

~ ∑ xⅈ ⋅ fⅈ
x=
n

Operando obtendremos como resultado que la media es: 182.

-Para determinar la moda en datos agrupados usaremos la siguiente fórmula.

M 0=Li +
( fⅈ + f i−1
)
( f i−fⅈ−1 ) + ( fⅈ+ f i̇+1 )
⋅a

Operando obtendremos como resultado que la moda es: 232.6.

-Para determinar la mediana en datos agrupados usaremos la siguiente fórmula.

( )
n
−Fⅈ−1
2
Mⅇ =Li + ⋅a
fⅈ

Operando obtendremos como resultado que la mediana es: 193.75.

2. Elaborar la tabla de frecuencias que muestren los datos que tenemos.


Li Ls xi fi Fi hi Hi xi*fi (xi-~
x )**2
1
70 90 80 16 16 0.08 0.08 1280 10404

2
90 110 100 12 28 0.06 0.14 1200 6724

3
110 130 120 8 36 0.04 0.18 960 3844

4
130 150 140 14 50 0.07 0.25 1960 1764

5
150 170 160 20 70 0.1 0.35 3200 484

6
170 190 180 24 94 0.12 0.47 4320 4

7
190 210 200 32 126 0.16 0.63 6400 324

8
210 230 220 34 160 0.17 0.8 7480 1444

9
230 250 240 40 200 0.2 1 9600 3364
3. La cantidad media que se han gastado, la cantidad más frecuente y la cantidad que tenían como
máximo el 50% de los trabajadores que menos cobraban.

La cantidad media que se ha gastado en los trabajadores es:


S/. 182.00.

La cantidad que tenía como máximo el 50% de los trabajadores que menos cobraban era:

Para calcular este valor nos ubicaremos en los primeros intervalos de clase, esto hasta alcanzar el 50%
de los trabajadores que por orden de la tabla se ubicaran entre los que menos cobraban, usaremos los
intervalos que van desde el número de clase 1 hasta el número de clase 6, teniendo así 104
trabajadores en total, buscando el límite superior de ese intervalo de clase obtendremos que la
cantidad que tenía como máximo el 50% de trabajadores que menos cobraba era S/. 190.00.

4. Calcula e interpreta el rango de la distribución, así como el rango intercuartílico.

-Para determinar el rango de distribución hallamos el límite superior y el límite inferior:

R=LS−Li

Obtenemos como que el rango de distribución es: S/. 180 lo que nos indica que la dispersión entre
nuestros datos es alta.

-Para determinar el rango intercuartílico usaremos:

IQR=Q 3−Q1

Pero para determinar el valor de cada cuartil individualmente usaremos:

( )
kn
−fⅈ −1
4
Qk =Li + A
F i−F i−1

Cuando Qk = Q1, k=1; Qk=Q2, k=2 y Qk=Q3, k=3 y cuando k.n/4 = Fi, Qk = Ls del mismo número de
clase que el Fi.

Entonces operando:

Q1 = 150.

Q2 = 193,75.

Q3 = 224.
Finalmente, el IQR es: Q3 – Q1 = 224 – 150 = 74.

5. Calcula el mínimo del 20 % de los empleados con mayor cantidad de viáticos.


¿Qué porcentaje del total de la empresa corresponde a este grupo?

Dado que buscamos el mínimo del 20% de los empleados con la mayor cantidad de viáticos, nos
enfocaremos en los intervalos de clase más altos. En este caso, el 20% corresponde a los dos
intervalos más altos: el intervalo 8 (210 - 230) y el intervalo 9 (230 - 250).
El número de empleados en el intervalo 8 es 34. El número de empleados en el intervalo 9 es 40.

Número total de empleados en el grupo = 34 + 40 = 74

Porcentaje correspondiente al grupo = (74 / 200) * 100 = 37%

Por lo tanto, el grupo que representa el mínimo del 20% de los empleados con la mayor cantidad de
viáticos corresponde al 37% del total de la empresa.

6. El intervalo centrado en la cantidad media en que se encuentran el 75 % de los datos. ¿Es, pues,
el sueldo medio muy representativo del conjunto de los viáticos?

Para calcular el intervalo centrado en la media primero debemos determinar el tipo de distribución de
nuestros datos, para determinar el mejor método para hallar los intervalos. Además, hallaremos el
coeficiente de curtosis para determinar el grado de concentración que presentan los valores de la
variable alrededor de la zona central de la distribución de frecuencias.

Donde si el coeficiente de curtosis;


K = 0 es Mesocúrtica, confirma que existe una
concentración de datos normal.
K < 0 es Platicúrtica, nos dice que existe una baja
concentración de datos.
K > 0 es Leptocúrtica, donde existe una alta
concentración de datos.

Usando la siguiente fórmula hallaremos el coeficiente de curtosis:

4
∑ ( xⅈ −x ) ⋅fⅈ
K= −3
N ⋅σ 4

Operando obtenemos el siguiente resultado:

2967811200
K= −3=736.977
4010678.42

K > 0, entonces nuestra distribución es Leptocúrtica.


Moda

Mediana

Media

Según el gráfico podemos distinguir que el tipo de nuestra distribución es de sesgo negativo, podemos
determinar esto siguiendo la curva en el histograma y según la esquematización de la distribución de las
medidas de tendencia central.
En resumen, nuestra distribución es de sesgo negativo y leptocúrtica, esto implica que hay una
concentración de valores más altos hacia la derecha de la distribución y una mayor probabilidad de
valores extremos tanto en el lado derecho como en el lado izquierdo. Esto puede indicar que hay una
parte significativa de la distribución con valores más altos y una mayor dispersión alrededor de la media.

Si bien existen otros métodos para hallar los intervalos centrados en la media como el teorema de
Chebyshev o la distribución Gamma, pero usamos el método de rango intercuartílico por ser el método
que más se ajusta a nuestro planteamiento ya que nos otorgará mayor precisión en una distribución con
sesgo negativo y con coeficiente de curtosis mayor a cero.

El rango intercuartílico (IQR) es una medida de dispersión que se calcula como la diferencia entre el
tercer cuartil (Q3) y el primer cuartil (Q1). El IQR es utilizado como una medida robusta de variabilidad,
ya que no se ve afectado por valores atípicos o extremos en los datos.

Para encontrar el límite inferior del intervalo centrado en la media, podemos restar la mitad del IQR a la
media:

Límite inferior = Media - (IQR / 2)

Límite inferior = 182 - (74 / 2) = 182 - 37

Límite inferior = 145

Para encontrar el límite superior del intervalo centrado en la media, podemos sumar la mitad del IQR a la
media:

Límite superior = Media + (IQR / 2)

Límite superior = 182 + (74 / 2) = 182 + 37

Límite superior = 219

Por lo tanto, el intervalo centrado en la media en el que se encuentran el 75% de los datos es de 145 a
219.

Entonces, respondiendo a la pregunta de si el sueldo medio es representativo del conjunto de los viáticos
podemos decir que dado que el sueldo medio de S/. 182 se encuentra dentro de este rango, indica que
es una estimación representativa del conjunto de los viáticos.

Además, la mediana de S/193 y la moda de S/. 232 también están cerca del sueldo medio, lo que
refuerza la idea de que el sueldo medio es representativo de los viáticos.

7. En el mes siguiente, la empresa decidió aumentar los viáticos de todos los trabajadores un 5 %.
Además, les dio una prima de 50 soles en concepto de productividad. Calcula el salario medio,
el salario más frecuente y el salario que tenían como máximo, el 50 % de los trabajadores que
menos cobran el mes siguiente.

Usando los datos anteriores como la media y moda descubriremos la nueva media y la nueva moda
afectando los valores anteriores en base a lo planteado:

La nueva media es:


5% x 182 = 9.1
182 + 9.1 + 50 = 241.1

La nueva moda es:

5% x 232.6 = 11.63

232.6 + 11.63 + 50 = 294.23


Siendo los datos afectados proporcionalmente y usando el dato de la respuesta a la pregunta 3
aplicamos la misma operación que usamos para hallar la nueva media y moda.

La nueva cantidad co

mo máximo que tenían el 50 % de trabajadores que menos cobran el mes siguiente es:

5% x 190 = 9.5

190 + 9.5 + 50 = 249.5

8. De los viáticos de otra empresa, que pertenece al mismo sector, se sabe que la media aritmética
de sus trabajadores es de 120 soles, con una varianza de 2,5 soles. ¿Qué empresa tiene un
viatico medio más representativo? Razona la respuesta.

Si el planteamiento de la pregunta es correcto usaremos la varianza de la empresa de la que


realizamos el análisis estadístico y la varianza otorgada de esta empresa; comparando datos, con una
media aritmética de 182 soles y una varianza de 141,78 soles y la otra empresa del mismo sector, con
una media aritmética de 120 soles y una varianza de 2,5 soles.

Vemos que la varianza de la primera empresa (141.78) es considerablemente mayor que la varianza de
la segunda empresa (2.5). Esto indica que la dispersión de los viáticos en la primera empresa es
mucho mayor que en la segunda empresa, lo que implica una mayor variabilidad en los datos alrededor
de la media.

Dado que la varianza de la segunda empresa es significativamente más baja, podemos concluir que la
media aritmética de 120 soles de la segunda empresa es más representativa y confiable en términos
de viáticos medios.

También podría gustarte