Regresion Lineal Simple + Coeficiente de Correlacion
Regresion Lineal Simple + Coeficiente de Correlacion
Regresion Lineal Simple + Coeficiente de Correlacion
OBJETIVO :
- Aprender como se puede aplicar el analisis de regresion para plantear
una ecueacion que relaciona dos variables.
Muchas veces las decisiones gerenciales se basan en la relacion entre dos o mas
variables.. Por ejemplo, despues de revisar la relacion entre los gastos de publicidad y
las ventas , un gerente de mercadotecnia podria tratar de predecir las ventas para
determinado nivel de gasto de publicidad. En otro caso , una empresa de electricidad
podria usar la relacion entre la temperatura maxima diaria y la demanda de
electricidad para predecir el consumo de energia en base a temperaturas maximas
pronosticadas ……podemos emplear un procedimiento estadistico llamado analisis de
regresion para plantear una ecuacion que muestre como dependen las variables entre
si.
Aplicando el analisis de regresion podremos plantear una ecuacion que muestre como
se relaciona la variable dependiente y con la variable independiente x.
Modelo y ecuacion de regresion :
Importante*
Lineas Posibles de regresion en la regresion lineal simple.
Metodos de los cuadrados minimos para calcular los parametros de la ecuacion de
regresion lineal.
Para ilustrar este metodo, supongamos que se reunieron datos de una muestra de 10
restaurantes :
OBJETIVO :
- Entender el concepto del coeficiente de correlacion como medida
Descriptiva de la intensidad de la asociacion lineal entre dos variables x y y.
Entender el concepto de coeficiente de determinacion :
SSE :
El valor de SSE es una medida del error que se comete al usar la ecuacion de regresion
para calcular los valores de la variable dependiente en la muestra.
Calculo de SSE para pizzeria Armands :
SSE : 1,530
Ahora supongamos que queremos determinar un estimado de las ventas sin conocer el
tamano de la poblacion de estudiantes. Sin conocer alguna de las variables
relacionadas usariamos la media de las muestras como estimado de las ventas en
cualquier restaurante.
En este ejemplo, este valor medio de las ventas es 1,300/10= 130.
En la siguiente tabla mostramos la suma de las desviaciones elevadas al cuadrado,
obtenida usando la media de la muestra. A la suma correspondiente de cuadrados, se
le llama suma total de cuadrados. STT (Sum of squares total)
STT :
SST = 15,730
En la siguiente figura se muestra la linea de regresion estimada y la que corresponde a
la media. Observe que los puntos se agrupan mas estrechamente alrededor de la linea
estimada de regresion que la linea y=130. por ejemplo para el decimo restaurante se ve
claro que el error es mucho mas grande cuando y = 130 se usa como estimado de y10
que cuando se usa la ecuacion de regresion. Podemos imaginar que SST es una
medida de lo bien que las observaciones se agrupan en torno a la recta y = x , y que
SSE mide lo bien que las observaciones se agrupan en torno a la ecuacion de regresion.
Para medir cuanto se desvian los valores de y medidos en la linea de regresion , de los
valores de la media , se calcula otra suma de cuadrados. A esta suma se le llama
suma de cuadrados debido a la regresion y se representa por SSR (Sum of squares due to
regression)
Coeficiente de correlacion
Es una medida descriptiva de la intensidad de la asociacion lineal entre dos variables, x
y y. Estos valores siempre estan en -1 y 1. un valor de +1 indican que las dos variables
tienen una relacion linal positiva perfecta. Esto es , todos los puntos de datos estan
sobre una linea recta con pendiente positiva. Un valor de -1 indica que x y y tinene una
relacion lineal negativa perfecta y que todos los puntos de datos estan sobre una recta
con pendiente negativa.
Los Valores de coeficiente de relacion cercanos a cero indican que x y y no tienen
relacion.