Análisis de Regresión y Correlación Tema 5 EA
Análisis de Regresión y Correlación Tema 5 EA
Análisis de Regresión y Correlación Tema 5 EA
Los primeros trabajos que conciernen con el estudio de la regresión se remontan al siglo XIX, cuando sir
Francis Galton (1822–1917) imbricó sus dos grandes aficiones: el estudio de la herencia y la expresión
matemática de los fenómenos vinculados a ella. Él fue el primero en trabajar con un conjunto de variables
y asignar a la relación entre dos variables un número para así obtener una medida tocante a su grado de
relación. Sostenía la idea de que personas excepcionalmente altas solían tener hijos de estatura menor,
mientras que personas muy bajas solían tener hijos más altos; este hecho fue enunciado por Galton como
la regresión a la media, aplicable a las tallas de una generación respecto de las siguientes. La justificación
que se da hoy día a esta situación es que los valores extremos de una distribución se deben en gran parte
al azar.
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables
cuantitativas. Se adapta a una amplia variedad de situaciones. En la investigación social, puede utilizarse
para predecir un amplio rango de fenómenos, desde medidas económicas hasta diferentes aspectos del
comportamiento humano.
Variable
Es la característica que se estudia u observa en los individuos (o elementos) que conforman el
conjunto de unidades a estudiar. En el caso que nos ocupa, la regresión lineal simple, se considera una
variable explicativa (X) y una variable de respuesta (Y); por tanto, las observaciones resultantes son
bidimensionales.
Datos
Son los valores numéricos asumidos por la variable en cada uno de los elementos que se estudian para
que puedan ser comparados, analizados e interpretados. Aquí utilizamos datos bivariados, esto es,
pares ordenados que pueden representarse como puntos en el plano cartesiano.
Gráfico de dispersión
El gráfico de dispersión o gráfico de la nube de puntos es una representación en un sistema de
coordenadas cartesianas de los datos numéricos observados sobre la relación entre dos variables.
Recta de regresión
El análisis de regresión consiste en una técnica estadística utilizada para investigar y modelar la
relación que hay entre una variable explicativa (X) y una variable de respuesta (Y). Para poder hacer tal
investigación, se debe postular un modelo que está formado por una componente determinística y
una componente aleatoria.
Variable
Es la característica que se estudia u observa en los individuos (o elementos) que conforman el conjunto de
unidades a estudiar. En el caso que nos ocupa, la regresión lineal simple, se considera una variable explicativa
(X) y una variable de respuesta (Y); por tanto, las observaciones resultantes son bidimensionales.
Datos
Son los valores numéricos asumidos por la variable en cada uno de los elementos que se estudian para que
puedan ser comparados, analizados e interpretados. Aquí utilizamos datos bivariados, esto es, pares
ordenados que pueden representarse como puntos en el plano cartesiano.
Gráfico de dispersión
El gráfico de dispersión o gráfico de la nube de puntos es una representación en un sistema de coordenadas
cartesianas de los datos numéricos observados sobre la relación entre dos variables.
Recta de regresión
El análisis de regresión consiste en una técnica estadística utilizada para investigar y modelar la
relación que hay entre una variable explicativa (X) y una variable de respuesta (Y). Para poder hacer
tal investigación, se debe postular un modelo que está formado por una componente determinística
y una componente aleatoria.
En la tabla inferior se muestran las puntuaciones recogidas a partir de una muestra de 27 sujetos en una
escala observacional de estrés y en un test orientado a evaluar la utilización de mecanismos de
afrontamiento. El rango de puntuaciones en ambas variables puede oscilar entre 0 a 100, significando
puntuaciones más altas mayor estrés y mayor capacidad de utilización de mecanismos de afrontamiento,
respectivamente.
Estrés
15 60
40
50 50 Estrés
25 58 30
20
10
0
0 10 20 30 40 50 60 70 80 90
Afrontamiento
423
𝑌ത = = 35,3
12
655
𝑋ത = 12 =54,6
𝑌 = 77,8 − 0,78 𝑋𝑖
𝑟 2 = 0,6668 = 66,68
𝛽0 = 35,3 − 0,78 54,6 = 77,8
Curva de regresión
90
80
70
60
50
Estrés
40
Estrés
30
20
10
0
0 10 20 30 40 50 60 70 80 90
Afrontamiento