Universidad Autónoma de Nuevo León Facultad de Ingeniería Mecánica Y Eléctrica Coordinación General de Ciencias Básicas
Universidad Autónoma de Nuevo León Facultad de Ingeniería Mecánica Y Eléctrica Coordinación General de Ciencias Básicas
Universidad Autónoma de Nuevo León Facultad de Ingeniería Mecánica Y Eléctrica Coordinación General de Ciencias Básicas
10 18
Aplicación en mi problema:
10 16 Al realizar los cálculos nos
encontramos con que la proyección
10 15 de la recta se mantiene de manera
ascendente y coincide con el
10 20
diagrama de flujo
50 86
50 90
50 88
50 88
50 92
∑x=300 ∑y=526
MEJOR ESTIMACION DE LA RECTA
X Y (XY) X2 Y2 FORMULAS
10 13 130 100 169
∑X2 ∑𝑦 − (∑𝑥)(∑𝑥𝑦)
𝑎=
10 18 180 100 324 𝑛 ∑𝑥2 − ∑𝑥 2
10 16 160 100 256 𝑛 ∑Xy − (∑𝑥)(∑𝑦)
𝑏=
10 15 150 100 225 𝑛 ∑𝑥2 − ∑𝑥 2
ŷ = 𝜶 + 𝒃𝒙
10 20 200 100 400
50 86 4300 2500 7396 INTERPRETACION
50 90 4500 2500 8100 𝑎=
13000 526 −(300)(23020)
=-1.7
2
10 13000 − 300
50 88 4400 2500 7744 10 23020 −(300)(526)
𝑏= =1.81
10 13000 − 300 2
50 88 4400 2500 7744
50 92 4600 2500 8464 ŷ = −𝟏. 𝟕𝟕 + 𝟏. 𝟖𝟏𝒙
Relación entre: ŷ=𝜶+𝒃𝒙 y Lectura en la
Presión (X)
ŷ=𝜷+𝒃𝒙 escala (Y)
Se espera que la recta ajustada
esté mas cerca de la verdadera 10 13
línea de regresión cuando se
dispone de una gran cantidad
10 18
de datos esto en comparación
a cada formula de la recta
10 16
10 15
Aplicación en mi problema: 10 20
Una vez realizados los cálculos
se mantiene la misma recta 50 86
“ascendente”.
50 90
Diagrama de flujo
50 88
50 88
50 92
∑x=300 ∑y=526
ERROR ESTÁNDAR EN LA MEJOR ESTIMACIÓN DE LA RECTA
x y y' y-y'2
10 13 16.33 216.09
10 18 16.33 388.09
10 16 16.33 313.29 FORMULA
10 15 16.33 278.89 2
∑ 𝑦−ŷ
10 20 16.33 470.89 S𝑦𝑥 =
50 86 88.73 7691.29 𝑛−2
50 90 88.73 8408.89 SUSTITUCIÓN
50 88 88.73 8046.09 42639.3
50 88 88.73 8046.09 S𝑦𝑥 =
10−2
50 92 88.73 8779.69
42639.3
Sumatoria (y-y')2 42639.3 S𝑦𝑥 = = 5329.91
Aplicación en mi problema:
8
Indica que tanto se desvían los datos de la media, si el
dato es grande la variación o diferencia (error) puede S𝑦𝑥 = 5329.91 = 73.006
ser proporcional a esta.
COEFICIENTE DE CORRELACIÓN DE PEARSON
X Y (XY) X2 Y2
10 13 130 100 169 Formulas
∑ 2∑ 2
10 18 180 100 324 2 𝑦 𝑦
𝑆𝑦𝑦 𝑆𝑦𝑦∑=
= 2
𝑦 −∑𝑦[ − [ ] ]
10 16 160 100 256 𝑛 𝑛
∑ 2
∑ 2
10 15 150 100 225 𝑥 𝑥
𝑆𝑥𝑥 𝑆=𝑥𝑥∑=𝑥2∑−𝑥2[ − [ ] ]
10 20 200 100 400 𝑛 𝑛
50 86 4300 2500 7396
𝑆(Ʃ𝑥)(Ʃ𝑦)
Sxy= 𝑟Ʃxy=− [ 𝑥𝑦 ]
50 90 4500 2500 8100 𝑛
50 88 4400 2500 7744
𝑆𝑥𝑥𝑆𝑦𝑦
𝑆𝑥𝑦
50 88 4400 2500 7744 𝑟= (Ʃ𝑥)(Ʃ𝑦)
50 92 4600 2500 8464 Sxy= Ʃ𝑆xy𝑥𝑥−𝑆𝑦𝑦
[ ]
𝑛
300 526 23020 13000 40822
Interpretación
2
526
𝑆𝑦𝑦 = 40822 − [ 10 ]=13154.4
2
300
𝑆𝑥𝑥 = 13000 − [ 10 ]=4000
(300)(526)
Sxy= 23020− [ ]=7240
10
7240
𝑟= =0.998≅ 1
4000∗13154.4
Aplicación en mi problema:
FORMULAS SUSTITUCIÓN
526 2
𝛿𝑦𝑦 = 40822 − [ ] = 13154.4
10
2
300
𝑆𝑥𝑥 = 13000 − [ 10 ]=4000
(300)(526)
Sxy= 23020− [ ]=7240
10
52417600
𝑟2 = = 0.996
4000 ∗ 13154.4
𝑟 = 0.996 = 0.998
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN EL
COEFICIENTE DE CORRELACIÓN DE PEARSON
DATOS FORMULAS
𝐻0 : 𝛽 = 1
𝐻1 : 𝛽 < 1
𝑏 = 1.81
𝑛 = 10
𝛼 = 0.05 Sustitución
SUSTITUCIÓN
𝑆𝑥𝑥 = 4000
𝑆 = 6.51
𝐼. 𝐶 = 95%
Conclusión Interpretación
Valores críticos de El intervalo de confianza para β y con un 95%
la distribución "𝑡" nos indica que se H0 rechaza debido a que la
Y 0.025 pendiente se encuentra por encima de 1 o es igual
a 1 tal y como se muestra en la grafica inferior.
8 2.306
α = 0.025
H0 𝑦 = 2.306
DATOS FORMULAS
𝐻0 : 𝛽 = 1 𝒕𝜶ൗ 𝑺 𝒕𝜶ൗ 𝑺
𝐻1 : 𝛽 < 1 𝒃− 𝟐 <𝜷<𝒃+ 𝟐
𝑺𝒙𝒙 𝑺𝒙𝒙
𝑏 = 1.81
𝑛 = 10
𝛼 = 0.05 Sustitución
SUSTITUCIÓN
𝑆𝑥𝑥 = 4000
𝑆 = 6.51
𝐼. 𝐶 = 95%
Valores críticos de la
distribución "𝑡"
Y 0.025
Conclusión
El intervalo de confianza para β y con un 95%
8 2.306
nos indica que la pendiente es menor a 1 como se
α = 0.025 puede apreciar en la gráfica que está debajo.
H0 𝑦 = 2.306
Se rechaza H0
La pendiente es menor a 1
Datos Fórmulas y'=-
𝑛 = 10
1 𝑥0 − 𝑥 2 1 𝑥0 − 𝑥 2 x 1.77+1.81
𝑎 = −1.77 𝜇0
𝑦ො0 − 𝑡𝛼Τ2 𝛿 + < ൗ𝑥0 < 𝑦ො0 + 𝑡𝛼Τ2 𝛿 + x
𝛽 = 1.81 𝑛 𝑆𝑥𝑥 𝑛 𝑆𝑥𝑥
𝑆𝑥𝑥 = 4000
𝑦ො = 𝑎 + 𝑏𝑥 𝛼=
1 − 𝐼𝐶
𝑦 =𝑛−2
10 16.33
𝑆 = 6.51 2
𝐼. 𝐶 = 95% 10 16.33
𝛼 = 0.05 10 16.33
Valores críticos de 1 − 0.95 ∑ 𝑥 300 10 16.33
𝛼= = 0.025 𝑥ҧ = =
la distribución "𝑡" 2 𝑛 10 10 16.33
𝛾 = 10 − 2 = 2 𝑡𝛼Τ2 = 2.306
𝜸 0.025 50 88.73
8 2.306
50 88.73
𝜇𝑦 50 88.73
Intervalos de confianza para 50 88.73
𝑥0
50 88.73
Sustitución
1 10 − 30 2
525.3 − 2.306 6.51 + = 510.2879
10 4000
1 10 − 30 2
525.3 + 2.306 6.51 + = 532.0136
10 4000
1 10 − 30 2 1 10 − 30 2
𝜇
525.3 − 2.306 6.51 + < 0ൗ𝑥0 < 525.3 + 2.306 6.51 +
10 4000 10 4000
𝑦ො = −1.77 + 1.81 10
𝜇
510.2879 < 0ൗ𝑥0 < 532.0136
Datos Fórmulas y'=-
𝑛 = 10 1 𝑥0 − 𝑥 2 𝜇0 1 𝑥0 − 𝑥 2 x 1.77+1.81
𝑎 = −1.77 𝑦ො0 − 𝑡𝛼Τ2 𝛿 1 + + < ൗ𝑥0 < 𝑦ො0 + 𝑡𝛼Τ2 𝛿 1 + +
𝑛 𝑆𝑥𝑥 𝑛 𝑆𝑥𝑥 x
𝛽 = 1.81
1 − 𝐼𝐶
𝑆𝑥𝑥 = 4000 𝑦ො = 𝑎 + 𝑏𝑥 𝛼= 𝑦=𝑛−2 10 16.33
2
𝑆 = 6.51
𝐼. 𝐶 = 95% 10 16.33
𝛼 = 0.05 10 16.33
Valores críticos de 1 − 0.95 ∑ 𝑥 300 10 16.33
𝛼= = 0.025 𝑥ҧ = =
la distribución "𝑡" 2 𝑛 10 10 16.33
𝛾 = 10 − 2 = 2 𝑡𝛼Τ2 = 2.306
𝜸 0.025 50 88.73
8 2.306
50 88.73
50 88.73
Intervalos de confianza para 𝜇𝑦 50 88.73
50 88.73
Sustitución
1 10 − 30 2
525.3 − 2.306 6.51 + = 558.992
10 4000
1 10 − 30 2
525.3 + 2.306 6.51 + = 591.882
10 4000
1 10 − 30 2 1 10 − 30 2
𝜇
525.3 − 2.306 6.51 1+ + < 0ൗ𝑥0 < 525.3 + 2.306 6.51 1+ +
10 4000 10 4000
𝑦ො = −1.77 + 1.81 10
𝜇
558.992 < 0ൗ𝑥0 < 591.882
Prueba de hipótesis para 𝜶
PLANTEAMIENTO
𝐻0: 𝛼 = 0
𝐻1: 𝛼 ≠ 0
Conclusión
Se acepta 𝐻0 , esto implica que hay
una correlación lineal significative
entre el costo de publicidad y
ventas.
PRUEBA DE HIPÓTESIS PARA 𝜷
Datos Fórmulas Sustitución
1.81 − 1
𝑛 = 10 𝑏−𝛽
𝑎 = −1.77 t = 6.51 =
t= 𝛿
Cuando la hipótesis nula es falsa y usted 4000
𝛽 = 1.81 𝐻1 = −0.490
no la rechaza, comete un error de tipo II.
𝑆𝑥𝑥 = 4000
La probabilidad de cometer un error de
𝑆 = 6.51
𝛿𝑥𝑥
tipo II es β, que depende de la potencia de
𝐼. 𝐶 = 95%
la prueba. Puede reducir el riesgo de
𝛼 = 0.05
cometer un error de tipo II al asegurarse
de que la prueba tenga suficiente
potencia. Para ello, asegúrese de que el 1 − 0.95
PLANTEAMIENTO
tamaño de la muestra sea lo 𝛼= = 0.025 Valores críticos de
𝐻0: 𝛼 = 0 2
suficientemente grande como para 𝛾 = 10 − 2 = 8 la distribución "𝑡"
𝐻1: 𝛼 ≠ 0
detectar una diferencia práctica cuando 𝑡𝛼Τ2 = 2.306
ésta realmente exista. 𝜸 0.05
8 2.306
𝐻0 = 2.306
Conclusión
Se acepta 𝐻0 , esto implica que hay
una correlación lineal significative
entre el costo de publicidad y
ventas.
MÉTODO DE ANÁLISIS DE LA VARIANZA
•Análisis de la Varianza ( ANOVA ) es una fórmula estadística que se utiliza para comparar las
varianzas entre las medias (o el promedio) de diferentes grupos. Una variedad de contextos lo
utilizan para determinar si existe alguna diferencia entre las medias de los diferentes grupos.
•Este método permite contrastar la hipótesis nula de que la media de más de dos poblaciones es
igual, frente a la hipótesis alternativa de que por lo menos una es diferente.
Analisis de Varianza para la classification unilateral
Fuente de Suma de Cuadrados Grados de Cuadrados de medios Calculada
Variación libertad
Tratamientos SCR(Tratamiento) K-1 𝐶M(tratameinto) 𝐶M(tratameinto)
𝑓=
Error SCE N-k 𝐶𝑀(𝐸𝑟𝑟𝑜𝑟) 𝐶𝑀(𝐸𝑟𝑟𝑜𝑟)
Total STCC n -1
Sustitución
826
𝑌ത = = 41.3
(10)(2)
2 2 2 2
8262
𝑆𝑆𝑇 = 6 + 7 + 11 + ⋯ 9 − = 19708.2
20
3002 + 5262 8262
𝑆𝑆𝐴 = − = 2553.8
10 10 2
𝑆𝑆𝐸 = 19708.2 − 2553.8 = 17154.4
2553.8 17154.4 2553.80
𝑆𝑖 2 = = 2553.80 𝑆2 = = 953.02 𝑓= = 2.679
1 2(10 − 1) 953.02
Analisis de Varianza para la classification unilateral
Fuente de Suma de Cuadrados Grados de Cuadrados de medios Calculada
Variación libertad
Tratamientos 2553.4 2-1=1 2553.4 2553.4
𝐶𝑀𝑡𝑟𝑎𝑡 = 2553.4 𝑓= = 2.679
1 953.02
Error 17154.4 20-2=18 17154.4
𝐶𝑀𝐸 = = 953.02
2(10 − 1)
Total 19708.2 10 -1=9
Conclusión
• Regresión polinomial
• El coeficiente de determinación R² se utiliza para medir cuánta • Ambos conceptos son fundamentales
variación en una variable dependiente puede explicarse por una en estadística inferencial y son útiles
variable independiente en un modelo de regresión, mientras en la ingeniería para comprender y
que la correlación (r) evalúa la relación lineal entre dos modelar relaciones entre variables.
variables.
PLANTEAMIENTO Presión Lectura en
(X) la escala (Y)
10 13
10 18
Para fines de calibración se
10 16
recabaron las siguientes datos , los
10 15
cuales permitirían determinar la
10 20
presión y la lectura
correspondiente en la escala. 50 86
50 90
50 88
50 88
50 92
FORMULAS
𝑦ො = 𝑏0 + 𝑏1 𝑥 + 𝑏2 𝑥 2
REGRESION POLINOMIAL
𝒏 𝑿 Y 𝑿𝒀 𝑿𝟐 𝑿𝟑 𝑿𝟐 𝒀 𝑿𝟒
Fila 3
1 ∗ 14400000 − 60 ∗ 240000 = 0
1 0 −500 −1.7 𝑎0 1 ∗ 434400 − 0 = 434400
0 1 60 1.81 𝑎1
0 0 0 434400 𝑎2
𝑎0 Calculos para resolver matriz 3x3
1 0 −500 −1.7
0 1 60 1.81 𝑎1
𝑎2 Fila 3
0 0 0 434400
0 434400
= 𝑖𝑛𝑑𝑡. = 𝑖𝑛𝑑𝑡.
0 0
𝑦ො = 𝑏0 + 𝑏1 𝑥 + 𝑏2 𝑥 2
Entonces, la ecuación de regresión estimada
𝑦ො = −1.7 − 1.81𝑥 + 𝑥 2
REGRESIÓN NO LINEAL MÚLTIPLE
• La regresión no lineal genera una ecuación para describir la relación no lineal entre una variable de
respuesta continua y una o más variables predictoras y predice nuevas observaciones.
• Utilice la regresión no lineal en lugar de la regresión de mínimos cuadrados ordinarios cuando no pueda
modelar adecuadamente la relación con parámetros lineales. Los parámetros son lineales cuando cada
término del modelo es aditivo y contiene solo un parámetro que multiplica el término.
REGRESIÓN LINEAL MÚLTIPLE
•Como la el modelo de regresión lineal es un modelo que explica la relación entre variables, a
diferencia de la primera esta utiliza más variables independientes llamadas regresores para
explicar la relación de la variable dependiente denominada como regresión.
•Esta es lineal debido a que las variables independientes siguen ese mismo orden.
•Es múltiple porque su ecuación es única compuesta de varias variables independientes.
SIMILITUDES
•Describen matemáticamente la relación entre una variable de
respuesta y una o más variables predictoras.
•Pueden modelar una relación curva.
•Minimizan la suma de los cuadrados del error residual (SSE).
•Tienen los mismos supuestos que usted puede verificar utilizando las
gráficas de residuos.
DIFERENCIAS
La diferencia fundamental entre las regresiones lineal y no lineal, y la base para los nombres de
los análisis, son las formas funcionales aceptables del modelo. Específicamente, la regresión
lineal requiere parámetros lineales mientras que la no lineal no. Utilice la regresión no lineal en
lugar de la regresión lineal cuando no pueda modelar adecuadamente la relación con
parámetros lineales.
REGRESIÓN POTENCIAL
Problema No. 1 X Y
Sea el siguiente conjunto de 10 13
valores, las lecturas de un
experimento donde X es la
10 18
variable independiente e Y la 10 16
variable resultante. 10 15
10 20
50 86
50 90
50 88
50 88
50 92
Formulas:
𝑦ො = 𝑎𝑥 𝑏
𝑛 ∑ log 𝑋 log 𝑌 − (∑ log 𝑋)(∑ log 𝑌)
𝑏=
𝑛 ∑(𝑙𝑜𝑔𝑋 2 ) − ∑ log 𝑋 2
𝑎=
∑ log 𝑌 − (𝑏)(∑ log 𝑋) ECUACION POTENCIAL
𝑛
ECUACIÓN POTENCIAL
∑ log 𝑌
log 𝑦 = = N X Y LOG (X) LOG (Y) LOG(X*Y) LOG(X^2)
𝑛
∑ log X 1 10 13 1.000 1.114 1.114 1.000
log 𝑥 =
𝑛
2 10 18 1.000 1.255 1.255 1.000
Sustitución:
15.79
3 10 16 1.000 1.204 1.204 1.000
log 𝑦 = = 1.579
10 4 10 15 1.000 1.176 1.176 1.000
13.49
log 𝑥 = = 1.349 5 10 20 1.000 1.301 1.301 1.000
10
𝑏 = 𝑦ത − 𝑎 ln 𝑥
ECUACION LOGARÍTMICA
∑ ln 𝑥
l𝑛 𝑥 =
𝑛 ECUACIÓN LOGARITMICA
N X Y ln(x) ln(x^2) y^2 ln(x)*y
1 10 13 2.303 5.302 169 29.9336062
Sustitución 2 10 18 2.303 5.302 324 41.4465317
3 10 16 2.303 5.302 256 36.8413615
(10)1925.75 − 526 31.073 4 10 15 2.303 5.302 225 34.5387764
𝑎= 5 10 20 2.303 5.302 400 46.0517019
10 103.029 − (31.073)2
6 50 86 3.912 15.304 7396 336.433978
=44.983 7 50 90 3.912 15.304 8100 352.08207
8 50 88 3.912 15.304 7744 344.258024
9 50 88 3.912 15.304 7744 344.258024
𝑏 = 52.6 − 44.983 3.1073
= −87.175 10 50 92 3.912 15.304 8464 359.906116
31.073 SUM 300 526 31.073 103.029 40822 1925.75019
l𝑛 𝑥 = = 3.1073
10
GRÁFICA
Formula:
COEFICIENTE DE DETERMINACIÓN
COEFICIENTE DE DETERMINACIÓN
∑ 𝑦ො − 𝑦ത 2 x y' ഥ
𝒚 (𝒚′ − 𝒚
ഥ)𝟐 ഥ)𝟐
(𝒚 − 𝒚
2
𝑅 = 10 16.402 52.600 1568.160 1310.282
∑ 𝑦 − 𝑦ത 2
10 16.402 52.600 1197.160 1310.282