Proyecto Final 100%
Proyecto Final 100%
Proyecto Final 100%
II.
“PROYECTO FINAL 100%”
ELABORADO POR:
PERIODO 2021-2
GRUPO: 4II11
ANTECEDENTES. ........................................................................................................... 1
OBJETIVO. ....................................................................................................................... 2
INTRODUCCIÓN ............................................................................................................. 3
ABSTRACT ...................................................................................................................... 4
METODOLOGÍA. ........................................................................................................... 26
EJEMPLO. ............................................................................................................... 26
EJEMPLO. ............................................................................................................... 28
EJEMPLO. ............................................................................................................... 31
EJEMPLO. ............................................................................................................... 34
EJEMPLO. ............................................................................................................... 37
EJEMPLO: ............................................................................................................... 43
CONCLUSIÓN................................................................................................................ 46
REFERENCIAS. ............................................................................................................. 47
ANEXOS. ........................................................................................................................ 48
ANTECEDENTES.
Ubicación:
Esquina AV. Organización Popular Con Felipe Barrio Zabal Santa Elena,
Chimalhuacán, Estado De México.
La rosticería “Jiménez”, inicio hace aproximadamente 30 años en sus inicios
como todo negocio fue abriendo clientela en la zona donde se ubicó y por medio
de su buena sazón y la buena preparación de sus pollos, comenzó rápidamente
a crecer en cuestión de ventas y a jalar mas publico siempre con su lema “su
precio es lo de menos, sabor y calidad sabor y calidad es lo que cuenta”.
1
OBJETIVO.
2
INTRODUCCIÓN
La estadística es un área muy amplia y muy diversa de las matemáticas. Sus aplicaciones han
abarcado prácticamente todas las disciplinas del quehacer humano. La Estadística Inferencial
es la parte de la Estadística que se encarga de estudiar procedimientos para la obtención de
conclusiones, referentes al total de la población, a partir de la información proporcionada por
la muestra o muestras seleccionadas. Es de gran utilidad en todos aquellos estudios de
investigación llevados a cabo en poblaciones demasiado grandes como para poder realizar
mediciones en todos y cada uno de los individuos de dichas poblaciones.
Por otro lado, el diseño de experimentos ha resultado ser una herramienta de gran impacto
para el progreso de la industria. Contribuye a conocer los procesos de una manera más
profunda, lo cual permite hacer mejoras en calidad y bajar los costos de producción por medio
de métodos científicos. El objetivo del diseño experimental es reducir al máximo la
variabilidad de los procesos, estudiando los factores que son considerados como de más alta
influencia sobre el proceso. Con el diseño de experimentos se pueden corregir defectos en
los productos, reducir consumos energéticos, analizar tipos de materiales, etc.
3
ABSTRACT
Statistics is a very large and very diverse area of mathematics. Its applications have
covered practically all disciplines of human activity. Inferential Statistics is the part
of Statistics that is responsible for studying procedures for obtaining conclusions,
referring to the total population, based on the information provided by the selected
sample or samples. It is very useful in all those research studies carried out on
populations that are too large to be able to carry out measurements on each and
every one of the individuals in said populations.
On the other hand, the design of experiments has turned out to be a tool of great
impact for the progress of the industry. It contributes to knowing the processes in a
deeper way, which allows making improvements in quality and lowering production
costs through scientific methods. The objective of the experimental design is to
minimize the variability of the processes, studying the factors that are considered to
have the highest influence on the process. With the design of experiments, it is
possible to correct defects in the products, reduce energy consumption, analyze
types of materials, etc.
4
MARCO TEORICO.
Suavización exponencial.
Los pronósticos de producción desarrollados con series de tiempo, hacen uso de los datos del
pasado para predecir el comportamiento de la demanda en el futuro.
Por tanto, de lo que se trata es de predecir qué va a pasar y lo que hace es suavizar la serie
temporal. El objetivo es reducir las fluctuaciones y conseguir observar una tendencia que a
veces no está clara a simple vista. Es muy utilizado, sobre todo, en previsión de ventas y ha
demostrado una eficacia más que aceptable.
Sin embargo, y a diferencia de otros métodos, el suavizado o alisamiento exponencial
funciona con muy pocos registros de periodos anteriores, destacando los hechos más
recientes sobre los más antiguos.
El método de suavización o suavizamiento exponencial simple puede considerarse como una
evolución del método de promedio móvil ponderado, en éste caso se calcula el promedio de
una serie de tiempo con un mecanismo de autocorrección que busca ajustar los pronósticos
en dirección opuesta a las desviaciones del pasado mediante una corrección que se ve
afectada por un coeficiente de suavización.
Así entonces, este modelo de pronóstico precisa tan sólo de tres tipos de datos: el pronóstico
del último período, la demanda del último período y el coeficiente de suavización.
El pronóstico de suavización exponencial simple es óptimo para patrones de demanda
aleatorios o nivelados donde se pretende eliminar el impacto de los elementos irregulares
históricos mediante un enfoque en períodos de demanda reciente, este posee una ventaja
sobre el modelo de promedio móvil ponderado ya que no requiere de una gran cantidad de
períodos y de ponderaciones para lograr óptimos resultados.
A diferencia de los métodos de promedio móvil simple y ponderado, este método no necesita
de gran volumen de datos históricos de la demanda. Por ende cada vez que se calcula el
pronóstico, se remueve la observación anterior y es reemplazada por la demanda más
reciente, y aquí es donde radica la ventaja.
Es el método de pronóstico más usado por su simpleza, tanto por pequeñas y grandes
empresas, sea en un sencillo archivo de Excel o un software como forecast pro. Sus ventajas
son:
5
Formulación es sencilla, pues solo requiere el pronóstico anterior, la demanda real del
periodo de pronóstico y la constante de suavización, como ya lo veremos más adelante.
No requiere de gran volumen de datos históricos.
Al ser un modelo exponencial, es más preciso.
Es flexible al conseguir darle más importancia a la demanda más reciente o a la antigua.
Su desventaja, al igual que los métodos de promedio móvil, es la respuesta a la tendencia.
Aun cuando un valor de alfa (α) logra responder frente a cambios en el promedio, cambios
sistemáticos de este harán más grande el error de pronóstico. Es tan así, que cuando se está
aplicando un alfa mayor a 0.5 con buenos resultados, optar por el alisado exponencial doble
suele ser mejor idea.
El método de suavización exponencial simple trabaja a través de una constante de
suavización alfa (α) que tiene un valor comprendido entre 0 y 1, aunque en la aplicación real
su valor suele variar entre 0,05 y 0,50.
La constante funciona como un factor de ponderación (si, parecido al pronóstico móvil
ponderado) y su variación se hace de acuerdo a nuestra necesidad de darle más peso a datos
recientes (alfa α más elevado) o a datos anteriores (alfa α más bajo). En este sentido, si α=1,
nuestro pronóstico de demanda del próximo periodo será exactamente igual al del periodo
actual.
En consecuencia, el alfa que elijamos estará relacionado con el índice de respuesta deseado
y la naturaleza del producto. ¿Por qué? Veamos. Por ejemplo, teniendo un producto o servicio
con demanda estable a través del año, nuestra constante de suavización tenderá a ser pequeña
(0,10 por ejemplo), debido a que, no requerimos un elevado índice de respuesta frente a los
cambios entre la demanda real y la demanda pronosticada.
Caso contrario es cuando la compañía comienza a tener un crecimiento en su demanda, lo
que va a requerir un alfa más elevado (0,30 por ejemplo) para dar mayor importancia a la
demanda reciente.
Como bien mencionamos antes, el cálculo es simple. Requerimos el pronóstico anterior, la
demanda real del periodo de pronóstico y la constante de suavización. Si es la primera vez
que usamos el método, el pronóstico anterior puede ser un estimado o el resultado de un
promedio simple, por ejemplo.
La fórmula de suavizamiento exponencial es la siguiente:
6
Fórmula de suavizamiento exponencial simple
Donde
Ft= Nuevo pronóstico
Ft-1= Pronóstico del periodo anterior
α = constante de suavización
At-1= demanda real del periodo anterior
Veamos una forma de cálculo sencilla. La fórmula, que mostramos con detalle en el ejemplo,
incluye una demanda real (Do) y un pronóstico (Po). Por otro lado, también se tiene en cuenta
el factor de suavización (alfa) expresado en tantos por uno.
Lo que hacemos, como veremos al final, es suavizar la serie. Sumamos al pronóstico del
período anterior (Po) la diferencia entre este y la demanda (Do) multiplicados por el factor
de suavización (alfa). Con esto conseguimos valores con menor variabilidad y se podrá
observar mejor la evolución de la serie temporal.
Por supuesto, existen modelos algo más complejos. Por un lado, el modelo Box-Jenkins y
por otro, el de Holt-Winter. Este último es muy útil por su sencillez y fácil utilización. No
vamos a entrar en detalles concretos, ya que nos excederíamos de nuestro objetivo de mostrar
la economía de forma sencilla.
Las ventajas de los métodos de suavización exponencial
Las ventajas son sobre todo la sencillez y la facilidad de aplicación, pero hay algunas más.
Mostramos las más relevantes a continuación:
No necesita de muchos datos históricos, a diferencia de otros métodos como el ARIMA.
Tiene una mayor precisión que otros al utilizar técnicas de modelado exponencial.
Es un método que goza de gran flexibilidad, al utilizar datos de demanda que pueden ser
elegidos por el investigador.
El llamado alisado exponencial doble permite reducir los problemas de pronóstico cuando el
factor de suavización es mayor a 0.5. Uno de sus pocos inconvenientes.
7
Promedio móvil
En estadística, una media móvil es un cálculo utilizado para analizar un conjunto de datos en
modo de puntos para crear series de promedios. Así las medias móviles son una lista de
números en la cual cada uno es el promedio de un subconjunto de los datos originales.
Por ejemplo, si se tiene un conjunto de 100 datos, el primer valor de la serie de medias
móviles podría ser el promedio de los primeros 25 términos, luego el promedio de los
términos 2 al 26, el tercer elemento de los términos 3 al 27 y así, hasta por último el promedio
de los últimos 25 números del 76 al 100.
Una serie de medias móviles puede ser calculada para cualquier serie temporal. Se usa para
demanda estable, sin tendencia ni estacionalidad; suaviza las fluctuaciones de plazos cortos,
resaltando así las tendencias o ciclos de plazos largos.
Una media móvil simple (Moving Averigüe) es la media aritmética de los datos anteriores.
En esta técnica elemental de predicción, cuanto más grande sea mayor será la influencia de
los datos antiguos. En contrapartida, si se selecciona una baja, se tendrán en cuenta datos más
recientes para nuestra predicción.
8
La simplicidad de esta técnica hace que sea objeto de críticas en lo que refiere a su
consideración equitativa de datos recientes y datos antiguos, sobre todo cuando los objetos
de la predicción son variables cuya variabilidad en el corto plazo es importante para obtener
una predicción eficaz, v.gr: análisis de demanda, nº ventas, etc. Además, en presencia de una
tendencia en la serie de datos, la media movil simple causa problemas de predicción.
En lugar de utilizar solo datos anteriores, se utilizan también datos posteriores a aquel del
cual se quiere obtener la media.
La media móvil ponderado es una media multiplicada por ciertos factores, que le dan
determinado peso a determinados datos. La media móvil ponderada (Weighted Moving
Averigüe) desarrolla y mejora las aplicaciones de la media móvil simple. Se trata de la media
aritmética de los valores anteriores ponderados según diferentes criterios. De esta forma, se
superan los inconvenientes que ofrece la técnica de media móvil simple pues, en función de
las características de los datos analizados podremos decidir si darle mayor importancia a
datos más antiguos o más recientes. Esta técnica será más eficiente que la media móvil simple
a la hora de adaptar rápidamente el valor de la predicción a fluctuaciones en los datos
recientes.
Regresión lineal
La regresión lineal es una técnica de modelado estadístico que se emplea para describir una
variable de respuesta continua como una función de una o varias variables predictoras. Puede
9
ayudar a comprender y predecir el comportamiento de sistemas complejos o a analizar datos
experimentales, financieros y biológicos.
La primera forma de regresión lineal documentada fue el método de los mínimos cuadrados
que fue publicada por Legendre en 1805, Gauss publicó un trabajo en donde desarrollaba de
manera más profunda el método de los mínimos cuadrados,1 y en dónde se incluía una
versión del teorema de Gauss-Márkov.
El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que emplean
modelos basados en cualquier clase de función matemática. Los modelos lineales son una
explicación simplificada de la realidad, mucho más ágiles y con un soporte teórico mucho
más extenso por parte de la matemática y la estadística.
Pero bien, como se ha dicho, se puede usar el término lineal para distinguir modelos basados
en cualquier clase de aplicación.
Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe la
relación entre una variable dependiente y (también conocida como la respuesta) como una
función de una o varias variables independientes Xi (denominadas predictores). La ecuación
general correspondiente a un modelo de regresión lineal es:
Y=β0+∑ βiXi+ϵ
10
Hipótesis del modelo de regresión lineal clásico:
Media cero: Para cada valor de perturbación tomará distintos valores de forma aleatoria, pero
no tomará sistemáticamente valores positivos o negativos, sino que se supone tomará algunos
valores mayores que cero y otros menores que cero, de tal forma que su valor esperado sea
cero.
Incorreción o independencia: para todo. Las covarianzas entre las distintas pertubaciones son
nulas, lo que quiere decir que no están correlacionadas. Esto implica que el valor de la
perturbación para cualquier observación muestral no viene influenciado por los valores de
las perturbaciones correspondientes a otras observaciones muestrales.
Regresores estocásticos. Los sistemas de ecuaciones simultáneas describen el
comportamiento de un vector de variables endógenas en función de un vector de variables
exógenas. Los regresores estocásticos surgen del hecho de que la variable endógena de una
ecuación puede entrar en otra como variable explicativa.
El modelo de regresión lineal simple sólo está conformado por dos variables estadísticas
llamadas Considera una única variable independiente o explicativa, y una variable
dependiente o respuesta, asumiendo que la relación entre ambas es lineal. Para la regresión
lineal simple, se asume que se relacionan mediante la relación funcional (siendo β1 y β0
estimadores) donde son constantes desconocidas llamadas coeficientes de regresión. β1: Se
trata del cociente entre la interacción obtenida entre ambas variables y la suma de cuadrados
de los valores de la variable dependiente. Este valor corresponde a la pendiente de la recta.
Por su parte, β0 es el resultado de la siguiente ecuación en la que aparecen los valores medios
11
correspondientes a ambas variables y el estimador β1 obtenido anteriormente. Este valor es
la ordenada en el origen.
Medicina
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco7
vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran
cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que
pudieran producir correlaciones espurias.
Química
La concentración de un elemento es uno de los parámetros de mayor importancia en los
procesos químicos aplicados en la industria. Esta cuantificación se puede obtener mediante
un espectrofotómetro, dispositivo que requiere se calibrado. Para ello se elabora una recta de
calibración que se obtiene a partir de la correlación entre la absorbancia de un patrón y la
concentración de la sustancia a controlar.10
Mecánica
En esta rama se utiliza la Regresión Lineal entre otros para ajustar la recta de Paris, una
ecuación que sirve para estudiar elementos sometidos a fatiga en función del número de
ciclos a los que se somete un material. La bondad del ajuste se comprueba representando el
conjunto de valores discretos a-Nm obtenidos experimentalmente, frente a la curva
correspondiente a la recta de Paris definida por los valores “C” y “m”.
12
Electricidad
En electricidad se puede obtener el valor de una resistencia en un circuito y su error mediante
un ajuste de regresión lineal de pares de datos experimentales de voltaje e intensidad
obtenidos mediante un voltímetro y un amperímetro.
Sensores
Calibración de un sensor de temperatura (termopar) en función de la caída de tensión y la
temperatura. Se estudia la forma en que varía la temperatura de un líquido al calentarlo. Se
calibra el sensor y simultáneamente se mide la variación de temperaturas en un líquido para
representar los datos obtenidos posteriormente mediante Regresión Lineal.
Física
Determinación del coeficiente de rozamiento estático de forma experimental a partir de la
medición del ángulo de inclinación de una rampa. Se realiza un montaje ajustando un circuito
para medir el ángulo de inclinación, y se realizan mediciones variando dicho. Mediante la
regresión lineal de los datos obtenidos, se obtiene la ecuación y el índice de correlación a fin
de saber el error.
Fabricación
Dos de los parámetros más importantes de una soldadura es la intensidad aplicada al hilo y
la velocidad de alimentación del mismo. Mediante técnicas de regresión lineal se elaboran
las rectas que relacionan estos parámetros con la separación entre el hilo y la zona a soldar.
Diseño de experimentos
Construcción
Mediante técnicas de regresión lineal se caracterizarán diversas cualidades del hormigón. A
13
partir del módulo de elasticidad es posible predecir la resistencia a la compresión de una
determinada composición de un hormigón. También se puede determinar la succión capilar
a partir del volumen absorbido por una muestra y el tiempo que ha durado la succión.
Aplicación de regresión lineal simple en el proceso de pigmentación de una empresa del
sector de la automoción
En la práctica, con mucha frecuencia es necesario resolver problemas que implican conjuntos
de variables, cuando se sabe que existe alguna relación inherente entre ellas. Por ejemplo, en
un caso industrial se puede saber que la pintura, para partes automotrices, está relacionada
con la cantidad de pigmentación con la que se lleva a cabo. Puede ser interesante desarrollar
un método de predicción, esto, un procedimiento para estimar el contenido de pigmentación
que deben de tener las pinturas para cumplir con las especificaciones de las armadoras como
se muestra en la siguiente imagen de tal manera que el problema consiste en lograr la mejor
estimación de la relación entre las variables.
Un diseño factorial con dos factores consiste en experimentar con todos los tratamientos que
se obtienen al combinar cada nivel de un factor con los niveles del otro. Se desea analizar si
el rendimiento de un determinado cultivo depende del tipo de semilla y de fertilizante
empleados.
En estadística, un experimento factorial completo es un experimento cuyo diseño consta de
dos o más factores, cada uno de los cuales, con distintos valores o niveles, cuyas unidades
experimentales cubren todas las posibles combinaciones de dichos niveles en todos los
factores. Este tipo de experimentos permiten estudiar el estudio del efecto de cada factor
sobre la variable respuesta, así como el efecto de las interacciones entre factores sobre dicha
variable.
Por ejemplo, con dos factores y dos niveles en cada factor, un experimento factorial tendría
en total cuatro combinaciones de tratamiento, y se le denominaría diseño factorial de 2×2.
Si el número de combinaciones en un diseño factorial completo es demasiado alto para su
procesamiento, puede optarse por un diseño factorial fraccional, en el que se omitan algunas
de las combinaciones posibles.
14
Los diseños factoriales fueron utilizados en el siglo XIX por Jhon Bennet Lawes y Henry J.
Gilbert de la Estación experimental de Rothamsted.
Ronald Fisher discutió en 1926 que los diseños «complejos», tales como los diseños
factoriales, eran más eficientes que estudiar un factor a la vez. Fisher escribió: «ningún
aforismo se repite tan frecuentemente respecto de las pruebas de campo, que aquel de que a
la Naturaleza debemos hacerle pocas preguntas, o, idealmente, hacérselas de a una. Quien
escribe está convencido de que este punto de vista está totalmente equivocado.
Un diseño factorial permite que el efecto de varios factores e incluso las interacciones entre
ellos sean determinados con el mismo número de ensayos que son necesarios para determinar
cualquiera de los efectos por sí solo con el mismo grado de exactitud.
Es posible que el término "factorial" no haya sido utilizado en forma impresa hasta 1935,
cuando Fisher la utilizó en su libro El diseño de experimentos.
Para ahorrar el espacio, los puntos en un experimento factorial de dos niveles se abrevian a
menudo con las cadenas de más y signos de menos. Las secuencias tienen tantos símbolos
como factores, y sus valores dictan el nivel de cada factor: − para el primer (o bajo) llano, y
+ para el segundo (o alto) llano. Los puntos en este experimento se pueden representar como
−−,+−,−+,y++.
Los puntos factoriales se pueden también abreviar cerca (1), a, b, y el ab, donde la presencia
de una letra indica que el factor especificado está en su alto (o en segundo lugar) nivel y la
ausencia de una letra indica que el factor especificado está en su (o primero) nivel bajo (por
ejemplo, “a” indica que el factor A está en su alto ajuste, mientras que el resto de los factores
están en su ajuste del punto bajo (o primero)). (1) se utiliza indicar que todos los factores
están en sus (o primero) valores más bajos.
15
Para poder finalmente obtener un modelo estadístico que nos indique el valor de respuesta al
modificar los factores.
Los investigadores sociales suelen utilizar diseños factoriales para evaluar los efectos de los
métodos de enseñanza, teniendo en cuenta la influencia de los factores socio-económicos y
la experiencia.
Es común que en las ciencias agrarias se utilicen diseños factoriales por la necesidad de las
pruebas de campo para probar el efecto de las variables en los cultivos. En esos estudios a
gran escala, es difícil y poco práctico aislar y probar cada variable individualmente.
Los experimentos factoriales permiten manipulaciones sutiles de un número mayor de
variables interdependientes. Si bien el método presenta limitaciones, es útil para una
investigación más eficiente y para permitir que los métodos estadísticos fuertes expongan
todas las correlaciones.
16
10%.
Sin embargo, como cualquier piscicultor sabe, la densidad de población también es crucial
para el crecimiento de los peces. Si no hay suficientes peces en un tanque, la capacidad
desperdiciada cuesta dinero. Si la densidad es demasiado alta, los peces crecen a un ritmo
más lento.
En lugar del experimento tradicional, los investigadores podrían utilizar un diseño factorial
y coordinar la prueba aditiva con diferentes densidades de población, tal vez eligiendo cuatro
grupos. Entonces, el experimento factorial necesitaría 4 x 2 u ocho tratamientos.
Las reglas tradicionales del método científico siguen vigentes. Por lo tanto, las estadísticas
exigen que todos los experimentos sean realizados por triplicado.
Esto implica 24 tanques de tratamiento separados. Por supuesto, los investigadores también
podrían probar, por ejemplo, 4 niveles de concentración para el aditivo y esto daría 4 x 4 o
16 tanques, es decir, 48 tanques en total.
En el ejemplo de piscifactoría, imagina añadir otro factor, como la temperatura, con cuatro
niveles en la mezcla. Entonces sería 4 x 4 x 4 o 64 carreras. Por triplicado, serían 192 tanques,
un proyecto enorme.
Existen otros métodos, tales como los diseños factoriales fraccionados, para reducir esto,
pero no siempre son estadísticamente válidos. Éstos se encuentran firmemente en el campo
de la estadística avanzada y se trata de proyectos largos, complicados y arduos.
Los diseños factoriales son muy útiles para los psicólogos y los científicos de campo como
17
estudio preliminar, ya que les permiten juzgar si existe una conexión entre las variables y
reducen la posibilidad de un error experimental y de variables de confusión.
El diseño factorial, además de simplificar el proceso y abaratar el costo de la investigación,
permite muchos niveles de análisis. Además de resaltar las relaciones entre las variables,
permite que sean aislados y analizados por separado los efectos de la manipulación de una
sola variable.
18
Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de los valores
de cada muestra con respecto a sus correspondientes medias.
Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las medias de las
muestras con respecto a la media global.
Las expresiones para el cálculo de los elementos que intervienen en el Anova son las
siguientes:
Media Global:
Variación Total:
Variación Intra-grupos:
Variación Inter-grupos:
Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su media.
Cuando la hipótesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la
varianza poblacional y el cociente entre ambos se distribuye según una F de Snedecor con
K-1 grados de libertad en el numerador y N-K grados de libertad en el denominador. Por lo
tanto, si H0 es cierta es de esperar que el cociente entre ambas estimaciones será
aproximadamente igual a 1, de forma que se rechazará H0 si dicho cociente difiere
significativamente de 1.
19
Prueba de homogeneidad de varianzas. Contiene el valor del estadístico de Levene del
contraste de la hipótesis de homocedasticidad con el nivel de significación crítico.
ANOVA. Contiene las sumas de cuadrados Inter grupos, intragrupo y total, sus
correspondientes grados de libertad y el valor del estadístico de prueba F junto con el nivel
de significación crítico.
Como complemento gráfico de este análisis, para obtener una primera aproximación acerca
de si es razonable o no la hipótesis nula, se selecciona Gráficos > Barras de error y se activa
la opción Simple. Con el botón Definir se abre el siguiente cuadro de diálogo:
Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de categorías la
variable factor.
El intervalo de confianza para la media se calcula por defecto al 95% de confianza. Al aceptar
aparece en el visor de resultados los puntos que representan a la media de cada grupo junto
con los límites del correspondiente intervalo de confianza para la media poblacional. Si los
puntos que representan las medias están desigualmente distribuidos en el gráfico se tiene un
indicio de que a nivel poblacional no puede sostenerse la hipótesis de igualdad de medias; es
decir, por lo menos uno de los niveles del factor influye significativamente sobre la variable
dependiente.
Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede aceptarse que
el tipo de transporte utilizado, Trans, influye sobre la variable tiempo.
Con la opción de menú Gráficos > Barras de error > Simple y con el botón Definir se
selecciona como Variable Tiempo y en Eje de categorías la variable Trans; al aceptar se
obtiene la siguiente representación gráfica:
Como puede observarse, los puntos que representan a las medias de cada grupo aparecen
dispersos a diferentes niveles; sobre todo la media del grupo definido por el factor Tren. El
intervalo de confianza para la media correspondiente al grupo definido por el factor Metro
está contenido dentro del intervalo correspondiente al grupo definido por el factor Bus, así
como, el intervalo correspondiente al factor Coche está contenido dentro de los intervalos
20
correspondientes definidos por los factores Metro y Otros. El gráfico, por tanto, parece
sugerir no una única población sino tres poblaciones con distintas medias.
Este cuadro contiene un análisis descriptivo de la variable dependiente por grupos, así como,
los límites superior e inferior para la media de cada grupo al 95% de confianza.
Por ejemplo, para estudiar la efectividad de diferentes medicamentos para la diabetes, los
científicos diseñan y experimentan para explorar la relación entre el tipo de medicamento y
el nivel de azúcar sanguínea resultante. La población de la muestra es un conjunto de
personas. Dividimos la población de la muestra en varios grupos y cada grupo recibe un
medicamento en particular durante un período de prueba. Al final del período de prueba, se
miden los niveles de azúcar sanguínea para cada uno de los participantes individuales. Luego,
para cada grupo, se calcula el nivel medio de azúcar sanguínea. ANOVA ayuda a comparar
las medias de estos grupos para averiguar si son estadísticamente diferentes o si son similares.
21
El resultado de ANOVA es la 'estadística F'. Esta ratio muestra la diferencia entre la varianza
dentro del grupo y la varianza entre grupos, lo que finalmente produce una cifra que permite
concluir que la hipótesis nula es respaldada o rechazada. Si hay una diferencia significativa
entre los grupos, la hipótesis nula no es compatible y la razón F será mayor.
Variable dependiente: este es el elemento que se está midiendo y que se teoriza como
afectado por las variables independientes.
Variable(s) independiente(s): estos son los elementos que se están midiendo y que pueden
tener un efecto sobre la variable dependiente.
Una hipótesis nula (H0): Sucede cuando no existe diferencia entre los grupos o medias.
Dependiendo del resultado de la prueba ANOVA, la hipótesis nula será aceptada o rechazada.
Una hipótesis alternativa (H1): Cuando se teoriza que existe una diferencia entre los grupos
y las medias.
Modelo de factor fijo: algunos experimentos utilizan solo un conjunto discreto de niveles
para los factores. Por ejemplo, una prueba de factor fijo evaluaría tres dosis diferentes de un
medicamento y no buscaría ninguna otra dosis.
Modelo de factor aleatorio: este modelo extrae un valor aleatorio de nivel de todos los valores
posibles de la variable independiente El análisis de la varianza unidireccional también se
conoce como ANOVA de un solo factor o ANOVA simple. Como sugiere el nombre,
ANOVA de una vía es adecuado para experimentos con una sola variable independiente
(factor) con dos o más niveles. Por ejemplo, una variable dependiente puede ser en qué mes
del año hay más flores en el jardín. Habrá doce niveles. Un ANOVA unidireccional asume:
Independencia: el valor de la variable dependiente para una observación es independiente del
22
valor de cualquier otra observación.
Normalidad: el valor de la variable dependiente se distribuye normalmente
Varianza: la varianza es comparable en diferentes grupos de experimentos.
Continuo: la variable dependiente (cantidad de flores) es continua y se puede medir en una
escala que se puede subdividir.
En ocasiones no se pueden asignar todos los tratamientos sobre cada bloque, de modo que se
tienen los diseños por bloques aleatorizados incompletos.
Suponemos que el número de unidades experimentales para cada bloque coincide con el
número de tratamientos, esto es, hay una observación para cada cruce de los niveles del factor
y del bloque. La variable respuesta Y puede depender de un primer factor de interés (A) y de
23
la variable bloque (B). El modelo es:
Yij = μ + αi + βj + εij
para i = 1,...,a y j = 1, . . . , b, siendo:
— μ el efecto medio global
— αi el efecto incremental sobre la media causado por el nivel i del factor A
— βj el efecto incremental sobre la media causado por el nivel j del bloque B
— εij el término de error.
diseño se conoce como diseño en bloques1
completos aleatorizados. La palabra completo
indica que todos los tratamientos se prueban en cada bloque.
24
En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los
resultados. Un factor de ruido es un factor que probablemente tiene un efecto en la respuesta
pero que no nos interesa estudiar. Si el factor de ruido es desconocido y no controlable,
lasolución es la aleatorización, que tiende a distribuir los niveles y efectos de este factor entre
todas las u.e.
Si el factor de ruido es conocido y no controlable, pero porlo menos podemos medir su valor
en cada corrida del experimento, entonces podemos compensarlo usando análisis de
convarianza. Si el factor de ruido es conocido y controlable, se utilizan bloques para eliminar
su efecto en la comparación estadística de los tratamientos.
Usar bloques estratifica a las u.e. en grupos homogéneos. Una buena elección del criterio de
bloqueo resulta en menor variación entre las u.e. dentro de los bloques comparada con la
variación entre u.e.
El diseño de bloques (completos) al azar implica que en cada bloque hay una sola observación
de cada tratamiento. El orden en que se “corren” los tratamientos dentro de cada bloque es
aleatorio (restricción en la aleatorización).
25
METODOLOGÍA.
SUAVIZACIÓN EXPONENCIAL:
Para este método requerimos el pronóstico anterior, la demanda real del periodo de
pronóstico y la constante de suavización. Si es la primera vez que usamos el método, el
pronóstico anterior puede ser un estimado o el resultado de un promedio simple, por ejemplo.
Fórmula.
Donde
α = constante de suavización
EJEMPLO.
La rosticería “Jiménez” desea pronosticar las ventas de pollo, para lo cual usarán como dato
inicial se usarán los anteriores.
El pronóstico de demanda del período 1 es 2869 ventas de pollo por personas, pero la
demanda para ese periodo fue de 3200. La compañía según su criterio asigna α=0,35.
Ft=Ft-1+a((At-1) - (Ft-1))
26
Se obtuvo la siguiente tabla comparativa entre lo realmente obtenido (demanda – segunda
columna) y lo pronosticado en ese momento (tercera columna).
3500
3000
2500
2000
1500
1000
500
0
1 2 3 4 5 6 7 8 9 10 11 12
27
Regresión lineal:
EJEMPLO.
28
Ventas en
Año
Miles
1 2015 685
2 2016 698
3 2017 710
4 2018 735
5 2019 745
6 2020 798
7 2021 821
8 2022 834
Incrementos en unidades del
año 2022
13
1.53%
VENTAS EN MILES
900
821 834
800 798
735 745
700 685 698 710
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8
29
PROMEDIO MÓVIL:
Fórmula
Sumatoria de datos
Número de datos
30
EJEMPLO.
VENTAS REALES
MES
(2009)
Enero 80
Febrero 90
Marzo 85
Abril 70
Mayo 80
Junio 105
Julio 100
Agosto 105
Septiembre 100
Octubre 105
Noviembre 100
Teniendo en cuenta los datos anteriores, se debe calcular un pronóstico mediante la técnica
de Promedio Móvil utilizando:
El objetivo consiste en identificar con cuál de los dos períodos del pronóstico se obtiene
mayor precisión al compararse con las ventas reales del reporte.
Al ser un pronóstico con un período móvil de 3 meses, este deberá efectuarse a partir del
mes de abril, es decir que para su cálculo tendrá en cuenta tres períodos, es decir, Enero,
Febrero y Marzo.
31
Luego para efectuar la previsión del mes de Mayo, deberán tenerse en cuenta los últimos
tres períodos que anteceden al mes de Mayo, es decir Febrero, Marzo y Abril.
Ventas Reales
Mes
(2009) Pronostico 3 Meses
Enero 80
Febrero 90
Marzo 85
Abril 70 85
Mayo 80 82
Junio 105 78
Julio 100 85
Agosto 105 95
Septiembre 100 103
Octubre 105 102
Noviembre 100 103
Diciembre 150 102
El pronóstico restante al ser un pronóstico con un período móvil de 6 meses, este deberá
efectuarse a partir del mes de Julio, es decir que para su cálculo tendrá en cuenta seis
períodos, es decir, Enero, Febrero, Marzo, Abril, Mayo y Junio.
32
De esta manera se efectúan las previsiones restantes obteniendo el siguiente resultado:
160
140
120
100
80
60
40
20
0
33
ANALISIS DE VARIANZA ANOVA:
Las expresiones para el cálculo de los elementos que intervienen en el Anova son las
siguientes:
Media/Global:
Variación Total:
Variación Intra-grupos:
Variación Inter-grupos:
EJEMPLO.
34
Maquina 1 Maquina 2
16.9 14.6
18.6 18.9
15.8 16.5
Total: 51.3 Total: 50 =101.3
Ho: m1 = m2
Hipótesis alternativa que al menos 1 es diferente
HI: M, > M2
Completar la tabla anova
1.elevar al cuadrado
Maquina 1 Maquina 2
285.61 213.16
345.96 357.21
249.64 272.25
Total: 881.21 Total: 842.62
M-1 M-2
TOTAL 61.2 58.3
4255.3 502.3
35
ET=32566.22
SSA=32566.22/4-426.472/ (2)(1) =4.66
SSE=SST-SSA
SSE=70.44-4.66=62.4
1.K-1 6-1=5
2.K(N-1) 6(4-1) 6(3) =18
3. N.K (1) (4)(6)-1 24-1=23
S12=4.99/6-1=4.66/5=0.563
S22=65.45/6(4-1) =65045/18=2.6666
F CALCULADA= S1/S2 = 0.9625/4.5623=0.51487
F CALCULADA=0.221
F TABLAS=2.523
36
BLOQUES COMPLETAMENTE ALEATORIOS.
EJEMPLO.
En una rosticería se contaban con 2 sitios para almacenar (con capacidad de 500 cajas) un
aspecto importante es para que se conserve el pollo. Por lo cual existe la posibilidad de que
en uno de los sitios hay problema con esta parte, por ello durante cierto tiempo (3 días) se
decide hacer un chequeo y registrar la temperatura de cada uno de los sitios.
Prueba de hipótesis
HO: =MA=MB
HO: al menos 1 media es diferente a las demás
A= 4 B= 5
Factor de interés-factor de bloqueo
37
Error 1.523 4 0.2851
total 12.36 15
SSF=BE YI2-N2
SSF= 5E (1.14+1.16+1.38+3.56)2-20(1.96)2=10.04
Suma de cuadros totales
SST= E E YIJ2-H Y2
SST= E
(1.3+1.6+0.5+1.2+1.1+2.2+2.4+0.4+2.0+0.4+2.0+1.8+1.7+0.6+1.5+1.6+3.9+4.4+2.0+4.1+
1.3+4.1-20 (1.96)2=25.688
Suma de cuadrados residuales
SSE=SST-SSF-SSB= 25.688-14.526-6.2559
Grados de libertad
A 4-1=3
B 5-1= 4
(a-1)(b-1)=(3)(4)=12
n-1= 29-1= 19
MS FACTOR= SSP/GLL (FACTOR)=18.044/3=2.256
MS BLOQUE= 6.563/5=0.2656
MS ERROR= 03285/255=2.06
VALOR F= MS (FACTOR)/MS(ERROR)
F(FACTOR)=6.13685/0.2335=59.23
F=1.2654/0.0296=19.20
38
39
DISEÑOS FACTORIALES CON 2 FACTORES:
Un diseño factorial con dos factores consiste en experimentar con todos los tratamientos que
se obtienen al combinar cada nivel de un factor con los niveles del otro. Se desea analizar si
el rendimiento de un determinado cultivo depende del tipo de semilla y de fertilizante
empleados.
EJEMPLO
Dos inspectores de calidad han realizado un estudio de nuestras máquinas de rostizado, del
mismo análisis de calidad midiendo el desempeño logrado en cada una de ellas, obteniendo
una calificación por cada uno de los inspectores por su desempeño y los resultados fueron
los siguientes:
Inspector 1 Inspector 2
52 52
21 38
28 47
86 63
54 35
47 14
12 45
Total:563 Total:632
X=65.23 X=101.2
5232 5252
2125 3854
2854 4778
8621 6312
40
5445 3565
4786 1454
1272 4596
E=56321 E=52325
EYI=53407.2351+55265=13698
T2=56325+632=5632
N=12+25+36=40.5=420
ETJ2=2562+5262+63252+122=25361
Y=41+56+58=99
GRADOS LIBERTAD
K-1=3-1=2
N-K=20-1=52
SST=EYJ2-T2/N
SSA=ETJ2-T2/N
SST=199.462-25632/5236=52369
SAA=SST-SSA=13025.32-323.54=42652.51
S21=926.32/2=236.23
S22=15236.36/39=2253.365
F=239526/23696.23=0.236
41
42
DISEÑOS FACTORIALES CON 3 FACTOR:
EJEMPLO:
En una rosticería se analizará para la producción de un pollo con 2 maquínalas contables para
manejará aleatoriamente.
La operación de las maquinas requiere determinar destreza física por lo tanto se anticipa que
43
Maquina operadora
1 2
1 42.5 26.3
2 26.3 45.2
3 25.2 78.2
4 12.3 58.3
E= 782.6 96.3
X= 40.23 50.365
total 12.321 25
SST=25632.32-5236.9/ (9)(7)=51.3256
SSA=(526.2)2+(235.2)2+(218.3)2+(236.2)2-1313.2/(7)(3)=SSB=56.236
SSE=23.236-15.23-56.23=45.32
S12=34.64/5=5.90
44
S22=?46.98/6=8.52
S2=34.65/4=1.236
S12/S2=5.32/2.78=6.54
45
CONCLUSIÓN.
A partir del desarrollo de este trabajo se entendió que la estadística inferencial es una base
que se usa para poder entender si hay una buena organización del medio con el cual se está
interactuando y de igual forma se podrán hacer adecuaciones con la finalidad de entender
cómo es que debemos de entender la organización de una producción.
Además de que le explicamos al Señor que era muy importante en otra ocasión hacer el
análisis con todos los datos posibles ya que nos daría resultados más exactos y con lo cual
nos adentraríamos más a dar una buena y correcta solución a su problemática con la finalidad
de que todas sus inversiones se adquirieran la mayor ganancia.
A modo de conclusión se han concluido con los puntos que se debían y podían analizar dentro
de este caso y que en posteriores proyectos o análisis de esta problemática se de gran ayuda
para los otros analistas este proyecto y de igual forma se espera que para la evaluación que
es para este proyecto pueda cumplir con las expectativas del evaluador y que existen
recomendaciones me las hagan saber.
46
REFERENCIAS.
¿Qué es la regresión lineal? (s. f.). MATLAB & Simulink. Recuperado 6 de julio de
2022, de https://la.mathworks.com/discovery/linear-regression.html
47
ANEXOS.
48